跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.175) 您好!臺灣時間:2024/12/10 17:14
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:郭哲佑
研究生(外文):Che-Yu Kuo
論文名稱:決策樹在中醫哮喘診斷之應用
論文名稱(外文):Applying Decision Tree to diagnosis of Asthma in Traditional Chinese Medical System
指導教授:王日昌王日昌引用關係
學位類別:碩士
校院名稱:長庚大學
系所名稱:資訊管理研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2004
畢業學年度:92
語文別:中文
論文頁數:62
中文關鍵詞:決策樹CART中醫哮喘
外文關鍵詞:Decision TreeCARTAsthma in Traditional Chinese Medical System
相關次數:
  • 被引用被引用:6
  • 點閱點閱:279
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:4
  決策樹在機器學習領域的應用,可以讓使用者從欲分析的資料中,取出其中所蘊含的規則,進一步運用在專家系統的推論引擎中。然而決策樹的演算法中,對於同質性指標的選取,影響了決策樹分類過程的速度。在樣本的收集過程往往出現不完整的資料,因此在缺失值的處理能裡也是很重要的問題。本研究中採用CART決策樹演算法,利用中醫哮喘的病歷資料進行測試決策樹,驗證其同質性指標的選擇、交叉驗證法的子集合分割個數以及對於不完整資料的處理能力;最後利用驗證結果擷取樣本中所蘊含的規則。
  根據本論文的分析結果發現,Gini index作為同質性指標優於Entropy以及Twoing Rule。而交叉驗證法僅需將樣本隨機分為10等份,若分割大於10對於正確率並無顯著的改善。在資料不完整的處理過程中,缺失程度高達43%時,準確率相較於任意猜測之結果約高於兩倍。經過CART所萃取的規則,與哮喘文獻進行比較發現,規則中所用到的舌色淡紅、脈象數皆與文獻所載相同。
  Decision tree can help users to extract rules from sample data to use in the inference engine of an expert system. In the algorithm of decision tree, how to measure the split criteria is an important issue. The sample data we get is always incomplete, so the process of missing values is also significant. CART (Classification and Regression Tree) algorithm is used in this research, using asthmatic medical records to verify split criteria, number of subsets in cross-validation and the ability of processing missing values. At last, we can get the rules hidden in the sample data with the results of the verification described above.
  According to the reports of the paper, gini index as the split criteria is better than entropy and twoing rule. The sample data is broken into ten subsets when using cross-validation. Arising the number of subsets doesn’t increase the hit ratio obviously. In the process of handling missing value, the hit ratio of the sample data with 43% missing value is as twice as the way when we guess arbitrarily. The rules extracted from the medical records are almost the same as the traditional Chinese Medical archives.
授權書…………………………………………………………………..iii
誌謝……………………………………………………………………..iv
中文摘要………………………………………………………………..v英文摘要………………………………………………………………..vi
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
1.3 研究範圍及限制 4
1.4 研究步驟與流程 5
第二章 相關文獻回顧 7
2.1 資料探勘 7
2.1.1 資料探勘的定義 7
2.1.2 資料探勘的步驟 8
2.1.3 資料探勘的功能 10
2.2 機器學習與決策樹 13
2.2.1 CART 17
2.2.2 CART的優點與缺點 19
2.3 中醫哮喘 21
2.3.1 哮喘的病機病因 21
2.3.2 哮喘的辨證分型 22
第三章 研究方法 27
3.1 CART演算法 27
3.2 樣本資料收集 38
3.3 挖掘工具簡介 40
第四章 資料分析與討論 45
4.1 樣本說明 45
4.2 分割條件選取 47
4.3 N-FOLD CROSS VALIDATION 49
4.4 不完整資料與正確性 51
4.4.1 不完整資料的產生 52
4.4.2 不完整資料試驗 54
4.5 規則擷取 56
4.6 小結 58
第五章 結論與建議 60
5.1 結論 60
5.2 後續研究建議 61
[ 參考文獻 ] 63
附錄 66
附錄一 中醫診療紀錄單 66
附錄二 問卷資料 67
附錄三 受測者同意書 71
附錄四 調查人員手冊 73
附錄五 樣本資料 74
西文部分
[1] Breiman, L., J.H. Friedman, R.A. Olshen, and C.J. Stone, Classification And Regression Trees. Belmont, California: Wadsworth, 1984.
[2] Berry, M.J.A. and G. Linoff, Data Mining Techniques: For Marketing, Sales, and Customer Support, New York: John Wiley&Sons, 1997.
[3] Cabena, P., “Discovering Data Mining: from Concept to implementation,” Upper Saddle River, New York: Prentice Hall, 1998.
[4] Fayyad, U., G. Piatetsky-Shapiro, P. Smithy and R. Uthurusamy, “Advances in Knowledge Discovery and Data Mining,” Menlo Park, Calif., AAAI/MIT Press, 1996.
[5] Fayyad, U., G. Piatetsky-Shapiro and P. Smithy, ”The KDD Process for Extracting Useful Knowledge from Volumes Data,” Communication of the ACM 39(11), 1996.
[6] Fayyad, U.M., Data mining and knowledge discovery: Making sense out of data, IEEE Expert, 11(5): 20-25, 1996.
[7] Fu Y., Data mining, IEEE Potentials, 16(4): 18-20, 1997.
[8] Grupe, G.H. and M.M. Owrang, “Database Mining Discovering New Knowledge and Cooperative Advantage,” Information Systems Management 12(4): 26-31, 1995.
[9] Han, J. and M. Camper, Data Mining:Concepts and Techniques. San Francisco, CA, USA, 2000.
[10] Krzystof, C., P. Witold, and S. Roman, Data Mining: Methods for Knowledge Discovery, Kluwer Academic Publishers, Boston, 1998.
[11] Quinlan, R., Induction of decision trees, Machine Learning 1: 81—106, 1986.
[12] Shaw, M.J., C. Subramaniam, and G.W. Tan, ” Knowledge management and data mining for marketing,” Decision Support System 31: 127-137, 2001.
[13] Shannon, C.E., A mathematical theory of communication, Bell System Technical Journal 27: 379—423 and 623-656. 1948.
[14] Simoudis, E., Reality check for Data Mining, IEEE Expert: 11(5), 26-33, 1996.
中文部分
[1] 趙恩檢,中醫症候診斷治療學,天津科學技術出版社,1992。
[2] 黃世林、孫明異,中醫脈象研究,知音出版社,台北市,1995。
[3] 李富生、牛滿山,常見病中醫臨床治療進展,中國中醫藥出版社,北京市, 1991。
[4] 馬斌榮,中醫專家系統與中醫知識庫,北京出版社,1998。
[5] 林輝慶,中醫師氣管支氣管炎過敏性鼻炎處方選輯,武陵出版有限公司,1997。
[6] 葉怡成、郭耀煌,專家系統方法應用與實作,全欣資訊,台北市,1991。
[7] 凌錫森、王行寬、陳大舜,中西醫結合內科學,中國中醫藥出版社,2001。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top