跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.89) 您好!臺灣時間:2024/12/12 02:26
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:鍾政旭
研究生(外文):Cheng-Hsu Chung
論文名稱:應用集成式學習於不孕症治療成功率預測之研究
論文名稱(外文):A Study of Outcome Prediction of IVF throughClassifier Ensemble Approach
指導教授:顧瑞祥顧瑞祥引用關係
指導教授(外文):Jui-Hsiang Ku
學位類別:碩士
校院名稱:國立虎尾科技大學
系所名稱:工業管理系工業工程與管理碩士班
學門:工程學門
學類:工業工程學類
論文種類:學術論文
論文出版年:2017
畢業學年度:105
語文別:中文
論文頁數:71
中文關鍵詞:試管嬰兒集成式演算法資料探勘
外文關鍵詞:InVitro FertilizationEnsembleData Mining
相關次數:
  • 被引用被引用:1
  • 點閱點閱:179
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在現今的醫療體系中,試管嬰兒(in vitro fertilization, IVF)治療是昂貴且痛苦的,到目前為止試管嬰兒的成功率普遍不高。本研究的目的在於應用資料探勘技術於 IVF 資料庫之分析,以集成式演算法中的 Ada-boosting 構建出一個預測模型;同時找出預測的規則,藉以探討影響 IVF 結果的因素之間的關係。本研究使用了簡單貝氏、決策樹、倒傳遞類神經網路及邏輯斯迴歸等工具分析 IVF資料庫,並且比較單一分類器與結合多種分類器之優劣。模擬結果顯示以四種演算法為基底分類器結合 Ada-boosting 集成式演算法分類效果最佳,分類準確率可達71.53%,而由誤差均方根與 ROC 曲線下面積評估的結果,也可知道集成式演算法的分類結果優於單一分類器,且當基底組合種類越多的時候,其分析結果也會優於數量較少的組合模型,表示其預測能力越好。本研究的結果,除了可提供給醫師及病患作為成功機率預測的參考,也可顯示集成式演算法的分類結果相較於單一分類器來的佳,使用多個不同的分類器建立的模型架構相對於使用單一分類器的模型,準確率較為準確與優良。
IVF treatment is both expensive and painful. So far, IVF success rates have remained low. The purpose of this study is to apply data mining techniques in IVF
database analysis in order to construct a predictive model through Ada-Boosting in integrated algorithms. In addition, simple Bayesian, decision tree,back-propagationnetwork, logisticregression analysis, and other tools were adopted to analyzethe IVF database and compare the soundness of single classifiers and a
combination of multiple classifiers. Simulation results show that with the four algorithms as the bases, the classifierscombined with the integrated algorithms
produce the best classification results, with the classificationaccuracy reaching 71.53%. The study results shall serve as a reference for physicians during success
rate determination and aid physicians in developing IVF treatment procedures that will contribute to improved success rates.
摘要.........................................i
Abstract ...................................ii
誌謝........................................iii
目錄....................................... iv
表目錄 .................................... vii
圖目錄 ................................... viii
第一章 緒論................................... 1
1.1 研究背景與動機 ............................1
1.2 研究目的 ................................ 2
1.3 研究限制.................................. 3
1.4 研究架構 ..................................3
第二章 文獻探討................................5
2.1 不孕症 ................................... 5
2.1.1 不孕症的原因 .............................5
2.1.2 試管嬰兒 .................................5
2.2 資料探勘(Data Mining) ....................... 6
2.2.1 資料探勘定義 ............................. 6
2.2.2 資料探勘流程 ............................... 7
2.2.3 資料探勘類型 ............................... 8
2.2.4 資料探勘的應用 ........................... 10
2.3 簡單貝氏 ................................. 11
2.4 決策樹(Decision Tree, DT) ..................... 13
2.4.1 決策樹的組成 ............................... 14
2.4.2 決策樹常見類型 .......................... 15
2.5 倒傳遞類神經網路(Back Propagation Neural Network, BPN)............... 17
2.6 邏輯斯迴歸(Logistic Regression, LR) ......... 20
2.7 集成式演算法(Ensemble methods) ............... 21
2.7.1 多數決投票(majority voting) ................. 22
2.7.2 推進法(Boosting) .......................... 23
2.7.3 Ada-boosting 演算法 ...................... 24
第三章 研究方法 .............................. 25
3.1 研究流程 ............................... 25
3.2 資料來源 .............................. 27
3.3 資料處理 ................................ 27
3.4 實驗軟硬體資訊 ............................ 30
3.4.1 WEKA 簡介..................................31
3.4.2 WEKA 文件系統格式 ........................ 32
3.5 模型建構說明..................................32
3.5.1 單一模型 ..................................32
3.5.2 集成式模型 ........................... 36
3.6 模型評估 ............................... 37
第四章 研究結果 ................................... 39
4.1 單一分類模型................................. 39
4.1.1 簡單貝氏(NB) ......................... 39
4.1.2 決策樹(J48)........................ 40
4.1.3 倒傳遞類神經網路(BPN) .................... 41
4.1.4 邏輯斯迴歸(LR) ........................... 43
4.1.5 單一分類模型之最佳參數整理................... 44
4.2 Ada-boosting 結合單一基底分類器模型 .......... 45
4.3 Ada-boosting 結合多種基底分類器模型 .......... 45
4.3.1 Ada-boosting 結合兩種基底分類器模型......... 46
4.3.2 Ada-boosting 結合三種基底分類器模型......... 46
4.3.3 Ada-boosting 結合四種基底分類器模型....... 47
4.4 模型評估與分析 ................................ 47
4.4.1 誤差均方根比較法 ......................... 47
4.4.2 接收者操作特徵曲線下面積比較法 ............ 53
第五章 結論與建議 ............................ 59
5.1 研究結論 ................................ 59
5.2 研究建議 ................................ 60
參考文獻 ..................................... 61
附件一 .................................... 65
Extended Abstract ......................... 66
簡歷................................. 71
1. 丁一賢、陳牧言(2006),資料探勘,滄海書局,台中。
2. 尹相志(2006),SQL Server 2005 資料採礦聖經,學貫行銷股份有限公司,台北。
3. 王文清、廖佳俊 (2016),學校建築耐震能力資料探勘模型評估與系統建置,災害防救科技與管理,5(1),1-25。
4. 吳欣儒(2011),資料探勘技術於病人疼痛自控裝置之應用與分析,國立交通大學資訊科學系,碩士論文。
5. 吳 品 潔 、 潘 湘 如 (2014), 男 性 不 孕 症 , 家 庭 醫 學 與 基 層 醫 療 , 29(11),284-289。
6. 李俊宏、古清仁(2010),類神經網路與資料探勘技術在醫療診斷之應用研究,工程科技與教育學刊,7(1),154-169。
7. 李雄飛、李輝(2003),數據挖掘與知識發現,高等教育出版社,北京。
8. 林承賦 、 陳明哲 、 劉夷生(2015),女性不孕症,家庭醫學與基層醫療,30(12),356 – 362。
9. 洪士程、林淑芬(2013),應用資料探勘技術於國小教師工作壓力之研究-以彰化縣為例,2013 年資訊科技國際研討會。
10. 孫世諺(2005),國語雙字語詞聲調評分方法之研究,台灣科技大學資訊工程系,碩士論文。
11. 翁慈宗(2009),資料探勘的發展與挑戰,科學發展期刊,442, 34-37.
12. 張顥鐘(2011),使用單純貝氏分類方法設計互動情境介面,國立臺北科技大學電機工程系碩士班,碩士論文。
13. 陳方柏(2013),整數規劃與資料挖掘於最佳裁切方式之應用,東海大學工業工程與經營資訊所,碩士論文。
14. 陳俊旗(2013),利用關聯演算法重現決策樹分類結果,靜宜大學資訊碩士在職專班,碩士論文。
15. 陳啟元(2003),資料探勘技術於健保資料之應用-以醫院門診服務點數預測為例,國立中正大學資訊管理研究所,碩士論文。
16. 彭文怡、朱經武(2006),季節性預測模式比較—以台灣地區國際港埠進口貨櫃預測為例,航運季刊,25(2),21-36.62
17. 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2006),資料探勘=Data Mining,旗標出版社。
18. 黃莉文(1990),不孕症治療法─ 試管嬰兒,慈濟醫學雜誌,2(1),82-85。
19. 黃意茹(2002),都市綠覆率與氣溫之相關性研究-衛星影像類神經網路分類法之應用,逢甲大學土地管理學系,碩士論文。
20. 葉怡成(2003),類神經網路模式應用與實作,儒林圖書有限公司,台北。
21. 葉怡成、吳沛儒(2009),基於類神經網路與交叉驗證法之田口方法,品質學報,16(4),261-279。
22. 葉宣萱(2011),消費金融無擔保客戶違約協商後毀諾─資料探勘技之應用,台灣金融財務季刊,12(4)。
23. 趙景明、楊清潭(2003),應用資料探勘於顧客價值預測─以醫療器材業為例,2003 年商情資料庫分析與建置之研究成果發表會。
24. 劉桂蘭(2009),不孕症的治療,中醫婦科醫學雜誌,12,52-53。
25. 劉蓓麗、李宜致、李威傑、李佳珂、林陽助、王偉 (2007),肥胖病人膽結石生成之預測因子研究,澄清醫護管理雜誌,3(3),29-36。
26. 蔡婷鈺、葉怡成、鄒明誠、李振民(2007),以六種資料探勘方法分析影響集集大地震引起山崩之重要因子,中華林學季刊,40(1),69-79。
27. 蕭世全(2006),資料探勘於建立精密模具試模知識研究,國立雲林科技大學資訊管理系碩士班,碩士論文。
28. 謝邦昌(1995),資料探勘與商業智慧-SQL Server 2005,鼎茂圖書,台北。
29. 謝和昆(2009),疾病分類支援系統之建構-以神經外科與放射科為例,東海大學工業工程與經營資訊學系,碩士論文。
30. 簡禎富、許嘉裕(2014),資料挖礦與大數據分析,前程文化,台北。
31. 蘇木春、張孝德(2004),機器學習:類神經網路、模糊系統以及基因演算法則,全華科技圖書股份有限公司,台北。
32. Altman, E. I., Marco, G. V. and Varetto, F., (1994). Corporate distressdiagnosis: comparisons using linear discriminant analysis and neural networks.Journal of Banking and Finance, Vol. 18, pp. 505-529.
33. Berzal, F., Cubero, J.C., Marit, N. & Sanchez, D. (2004). “Building multi-waydecision trees with numerical attributes,” Information Sciences, Vol.165, No.1,pp. 73-90.
34. Breiman, L., Friedman, J., Olsjen, R. & Stone, C. (1984). Classification and 63Regression Trees, Wadsworth Statistics.
35. Chen, M.S.,Han, J. & Yu, P.S. (1996). Data mining : an overview from adatabase perspective, IEEE Transactions on Knowledge and Data Engineering,8(6), 886-883.
36. Chun-Lang Chang & Chih-Hao Chen, (2009). Expert Systems with Applications, Expert Systems with Applications, 36, 4035-4041.
37. Clark, P. & Niblett, T. (1989). The CN2 Induction Algorithm, Machine Learning, 3, 261-283.
38. Dietterich T.G. (2000). Ensemble methods in machine learning, Proceedings of the First International Workshop on Multiple Classifier Systems (MCS00),1-15.
39. Domingos, P. & Plazzani, M. (1997). On the Optimality of the Sample Bayesian Classifier under Zero One Loss, Machine Learning, 29, 203-130.
40. Dursun, D., Christie, F., Charles, M.C. & Deepa R.,(2007). Analysis of healthcare coverage : A data mining approach”. Expert Systems with Applications.
41. Freund, Y. & Schapire. (1996)., R. Experiments with a new boosting algorithm,In Proc. 13th International
Conference on Machine Learning, 148 -156.
42. Freund, Y. & Schapire, R.E. (1997). A decision theoretic generalization of on-line learning and an application to boosting, Computer System Science,
57(1), pp. 119-139.
43. Han, J. & Kamber, M. (2006). Data Mining : Concept and Techniques, Second Edition, San Francisco, Morgan Kaufmann.
44. Hastie, T., Friendman, J. & Tibshirani, R. (2001). The elements of statistica learning, Springer-Verlag, New York.
45. K. Demyttenaere, L. Bonte, and M. Gheldof
(1998).Coping style and depression level influence outcome of in vitro fertilization, Fertility and Sterility , 69, 1026-1033.
46. Kass, G.V. (1980). An Exploratory Technique for Investigating Large Quantities of Categorical Data, Journal of Applied Statistics, 29(2), 119-127.
47. Langley, P. & Sage, S. (1994). Induction of Selective Bayesian Classifiers, Proceedings of the Tenth Conference on Uncertainty in Artificial Intelligence, 64399-406.
48. Leshowitz, B.(1969). Comparison of ROC curves from one and two interval rating-scale procedures, The Journal of Acoustical Society of America, 46(2B),399-402.
49. Nilsson, N.J. (1965). Learning machines: Foundations of trainable pattern classifying systems, McGraw-Hill.
50. Odom, M., and Sharda, R, (1990). A neural network model for bankruptcy prediction, Proceeding of International Joint Conference on Neural Networks,163-168.
51. Quinlan, J.R. (1986). Induction of Decision, Machine Learning, 1(1), 81-106.
52. Quinlan, J.R. (1993). C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers, San Mateo, CA.
53. Rumelhart, D.E., Hinton, G.E., Williams, R.J. (1986). Learning Internal Representations by Back-propagating Errors, Parallel Distributed Processing:Explorations in the Microstructure of Cognition, MIT Press, 1, 318-362.
54. S. Lee, (2010).Using data envelopmentanalysis and decision trees for efficiency analysis and recommendation of B2C controls,.Decision Support Systems, 49, 486-497.
55. Schapire, R. E. (1990). The strength of weak learnability, Machine learning,5(2), 197-227.
56. Tong, Rosemarie.(1997). Feminist approaches to bioethics: theoretical reflections and practical applications. Boulder, Colorado: Westview.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top