跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.31) 您好!臺灣時間:2025/11/15 08:25
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:陳民弦
研究生(外文):Min-Hsien Chen
論文名稱:植基於樹狀機率與類神經算法之糖尿病分類器-以台中慈濟醫院為例
論文名稱(外文):A Hybrid Classifier for Type 2 Diabetes Based on Decision Tree, Probabilistic Model and Artificial Neural Network- An Empirical Study of Taichung Tzu-chi General Hospital
指導教授:蔡孟勳蔡孟勳引用關係
口試委員:韓志平詹永寬
口試日期:2017-06-28
學位類別:碩士
校院名稱:國立中興大學
系所名稱:資訊管理學系所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2017
畢業學年度:105
語文別:中文
論文頁數:47
中文關鍵詞:糖尿病資料探勘
外文關鍵詞:DiabetesData Mining
相關次數:
  • 被引用被引用:2
  • 點閱點閱:215
  • 評分評分:
  • 下載下載:22
  • 收藏至我的研究室書目清單書目收藏:1
全民健保自1995開辦以來得到了民眾70%的支持。從健保費用逐年增長, 2007年到2017年健保有過資金短缺的情況,了解民眾總體對健保的使用率非常高。另一方面,台灣的人口結構邁向老人化,預計2025年占台灣總人口數約20%,老年人口的提升,就醫的比率跟著提高,隨之增加醫療成本的負擔。
2016年度的10大死因統計分析顯示糖尿病從1995年到2016年仍在10大死因前五名之內,為達到早期預防早期治療,本研究利用資料探勘演算法建立第二型糖尿病的早期預測模型,找出相關因子提供醫師於臨床診斷,降低醫療成本促進醫療健康品質。本研究收錄台中慈濟醫院2009到2016年糖尿病與非糖尿病之病人共1,326筆資料,收集病人的人口統計及臨床屬性,並以決策樹、類神經網路、樸素貝氏演算法進行分析。本研究發現尿液白蛋白與肌酸酐的比值(UACR)、年齡(AGE)、三酸甘油酯(TG)、血液肌酸酐(Creatinine)、高密度膽固醇(HDL)、性別(Gender)為模型中重要的因子,使用資料探勘演算法建置模型時,未使用飯前血糖(AC)與糖化血色素(HbA1C)的模型正確率為75%,ROC曲線下面積皆有0.78以上,加上兩項屬性時的正確率有98%,ROC曲線下面積皆有在0.97以上,模型建置在預測有或無糖尿病都有不錯的效果。本研究將資料探勘技術與醫療資料進行結合應用建置早期預測疾病的模型,了解到實際影響疾病的因子,提供醫療臨床與資訊應用的整合。
The National Health Insurance of Taiwan has been gained 70% support from the peoples since 1995. The NHI costs is increasing year by year and keeps shortage of funds from 2007 to 2017, that seems NHI has high utilization rate. Taiwan's elderly population rate is increasing, and it will account for 20% of total population in 2025. With the increase of the elderly population, the burden of health care costs gets more and more .In 2016, annual top ten causes of death show that Diabetes was within the top 5 during 1995 to 2016. To achieve early prevention, early treatment, and find out related factors of Diabetes for clinical diagnosis, this study uses data mining algorithms to establish prediction model of Type II Diabetes mellitus. The cases of study collected from Taichung Tzu Chi Hospital including those patients with and without diabetes during 2009 to 2016, which have total 1,326 patients .The cases of study were analyzed by Decision tree, Neural networks, and Naive Bayesian algorithms. The result shows that urine albumin-creatinine ratio, age, triglycerides, creatinine, high density cholesterol and gender are important factors in the model. While building a model without glucose AC and HbA1C, the accuracy is 75% and the area under the curve is above 0.78. With glucose AC and Hba1c, the accuracy is 98%, the area under the curve is above 0.97. These models have good prediction ability both in diabetic and non-diabetic subjects. The study combined data mining techniques with medical data building prediction models, provide the knowledge of the real impact factors of disease and the integration of medical information and clinical applications.
摘要 i
Abstract ii
目錄 iii
表目錄 v
圖目錄 vi
第1章 緒論 1
1.1研究背景與動機 1
1.2研究目的 2
1.3研究流程 2
第2章 文獻探討 3
2.1糖尿病說明 3
2.2資料探勘與醫療結合的應用 4
2.3決策樹演算法 5
2.4隨機森林演算法 6
2.5類神經演算法 7
2.5.1類神經網路原理 7
2.5.2倒傳遞類神經 8
第3章 研究方法 10
3.1.研究架構設計與資料收集 10
3.2 資料預處理與屬性說明 12
3.2.1屬性資料說明: 13
3.3特徵選取 14
3.4.模型建置 15
3.5 評估資料探勘模型 16
第4章 研究結果與討論 18
4.1.研究環境配置 18
4.1.1研究設備如下 18
4.1.2研究使用軟體 18
4.1.3研究資料 18
4.2資料預處理轉換 19
4.3特徵選取 21
4.4模型建置 22
4.4.1 Weka-J48 22
4.4.2 Weka-Random Forest 24
4.4.3 Weka-MLP 26
4.4.4 Weka-Naïve Bayes 28
4.5 R語言 30
4.5.1 R語言-Decision Tree C5.0 30
4.5.2 R語言- Random Forest 31
4.5.3 R語言-ANN 32
4.5.4 R語言-Naïve Bayes 33
4.6.綜合比較 34
4.7.第二次實驗結果 37
4.7.1第二次實驗結果 Weka-J48 38
4.7.2第二次實驗結果 Weka-Random Forest 38
4.7.3第二次實驗結果 Weka-MLP 39
4.7.4第二次實驗結果 Weka-Naïve Bayes 39
4.8討論 42
第5章 結論 43
參考文獻 45
中文文獻
[1]衛生福利部. 105年死因記者會新聞稿. 衛生福利部新聞稿. 取自:http://dep.mohw.gov.tw/DOS/cp-3352-33575-113.html
[2]衛生福利部中央健保署. 全民健康保險醫療品質資訊公開網. 取自http://www.nhi.gov.tw/mqinfo/Content.aspx?List=1&Type=DM
[3]衛生福利部中央健保署. 全民健康保險簡介,全民普及納保財務平衡. 取自:http://www.nhi.gov.tw/Content_List.aspx?n=1629DB7B0FB8C3D4&topn=FB01D469347C76A7
[4]中華民國糖尿病學會.全民糖尿病觀測站.取自:http://www.diabetes.org.tw/
[5]廖介銘(2003)。決策樹應用於糖尿病之探勘。碩士論文,華梵大學資訊管理學系碩士班,新北市。
[6]徐慧君, 翁慧卿, 林育慈, 陳淑銘, 李佩儒, 李集美, . . . 李洮俊(2004)。糖尿病患介入疾病管理在經濟面、臨床面及滿意度成效評估之初探-以南部某區域醫院糖尿病病患為例。醫務管理期刊, 5(2),頁 222-242。
[7]邱一薰(2005)。類神經網路預測台灣50股價指數之研究。碩士論文,國立彰化師範大學資訊管理學系所,彰化縣。
[8]李佩賢, 張弘育, 董淳武, 徐永建, 雷振宙, 張洵浩, . . . 林俊良(2009)。一個容易被忽略的徵兆:微白蛋白尿。內科學誌, 20(4),頁 275-284。
[9]范光中, & 許永河(2010)。台灣人口高齡化的社會衝擊。台灣老年醫學暨老年學雜誌, 5.3,頁 149-168。
[10]李俊宏, & 古清仁(2010)。類神經網路與資料探勘技術在醫療診斷之應用研究。工程科技與教育學刊, 7(1),頁 154-169。
[11]蔡佳玲, 洪新原, & 袁繼銓(2011)。以決策樹模型探討未開立慢性病連續處方之影響因子。資訊管理學報, 18(4),頁 139-164。
[12]林渤越(2013)。以全民健康保險資料庫探討國人慢性疾病的現況。碩士論文,國立政治大學統計研究所,台北市。
[13]衛生福利部國民健康署(2015)。糖尿病與我。取自:http://tmue.lib.apabi.com/List.asp?lang=big5
[14]楊勝雄(2015)。運用資料探勘技術進行糖尿病前期危險因子分析—以屏東某區域醫院為例。屏東科技大學資訊管理系所。
[15]吳建廷, 程秀蘭, 胡雅涵, 童建學, & 彭子安(2016)。比較三種資料探勘演算法預測類型風溼性關節炎預後之研究。北市醫學雜誌, 13(3),頁 98-110。

英文文獻
[16]A.D.A. Diabetes Basics Diagnosis. from http://www.diabetes.org/diabetes-basics/diagnosis/
[17]A.D.A. Type 2 Diabetes Risk Test. from http://www.diabetes.org/are-you-at-risk/diabetes-risk-test/
[18]Quinlan, J. R. (1993). C4. 5: Programs for Machine Learning.
[19]Fayyad, U., PiatetskyShapiro, G., & Smyth, P. (1996). The KDD process for extracting useful knowledge from volumes of data. Communications of the Acm, 39(11), 27-34.
[20]Stehman, S. V. (1997). Selecting and interpreting measures of thematic classification accuracy. Remote sensing of Environment, 62(1), 77-89.
[21]Tin Kam, H. (1998). The random subspace method for constructing decision forests. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(8), 832-844.
[22]Stratton, I. M., Adler, A. I., Neil, H. A., Matthews, D. R., Manley, S. E., Cull, C. A., . . . Holman, R. R. (2000). Association of glycaemia with macrovascular and microvascular complications of type 2 diabetes (UKPDS 35): prospective observational study. BMJ, 321(7258), 405-412.
[23]Shaw, M. J., Subramaniam, C., Tan, G. W., & Welge, M. E. (2001). Knowledge management and data mining for marketing. Decision Support Systems, 31(1), 127-137.
[24]Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.
[25]Cios, K. J., & Moore, G. W. (2002). Uniqueness of medical data mining. Artificial Intelligence in Medicine, 26(1-2), 1-24.
[26]Lu, J. F. R., & Hsiao, W. C. (2003). Does universal health insurance make health care unaffordable? Lessons from Taiwan. Health Affairs, 22(3), 77-88.
[27]Guyon, I., & Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of machine learning research, 3(Mar), 1157-1182.
[28]Fawcett, T. (2006). An introduction to ROC analysis. Pattern recognition letters, 27(8), 861-874.
[29]Han, J., Pei, J., & Kamber, M., Data mining: concepts and techniques. 2011: Elsevier.
[30]Tripoliti, E. E., Fotiadis, D. I., & Manis, G. (2012). Automated Diagnosis of Diseases Based on Classification: Dynamic Determination of the Number of Trees in Random Forests Algorithm. IEEE Transactions on Information Technology in Biomedicine, 16(4), 615-622.
[31]Chang, C. H., Jiang, Y. D., Chung, C. H., Ho, L. T., & Chuang, L. M. (2012). National trends in anti-diabetic treatment in Taiwan, 2000-2009. Journal of the Formosan Medical Association, 111(11), 617-624.
[32]Wijaya, R., Prihatmanto, A. S., & Kuspriyanto. (2013, 26-28 Nov. 2013). Preliminary design of estimation heart disease by using machine learning ANN within one year. Paper presented at the 2013 Joint International Conference on Rural Information & Communication Technology and Electric-Vehicle Technology (rICT & ICeV-T).
[33]Aneja, S., & Lal, S. (2014, 11-13 Dec. 2014). Effective asthma disease prediction using naive Bayes — Neural network fusion technique. Paper presented at the 2014 International Conference on Parallel, Distributed and Grid Computing.
[34]WHO. (2016). Diabetes Global Report. from http://www.who.int/diabetes/global-report/en/
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top