跳到主要內容

臺灣博碩士論文加值系統

(44.210.83.132) 您好!臺灣時間:2024/05/25 19:27
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:葉泰均
研究生(外文):Tai-Jiun Ye
論文名稱:運用類神經網路探討大腸異常之相關健檢項目與預測模型
論文名稱(外文):Using Neural Network to Predict Colon Abnormalities with Health Examination Items
指導教授:孫德修孫德修引用關係
指導教授(外文):Te-Hsiu Sun
學位類別:碩士
校院名稱:朝陽科技大學
系所名稱:工業工程與管理系碩士班
學門:工程學門
學類:工業工程學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:62
中文關鍵詞:健康檢查類神經網路大腸癌
外文關鍵詞:neural networkshealth checkscolorectal cancer
相關次數:
  • 被引用被引用:3
  • 點閱點閱:677
  • 評分評分:
  • 下載下載:101
  • 收藏至我的研究室書目清單書目收藏:0
近年來國人越來越重視健康檢查,健康檢查的目的在於早期發現疾病、早期治療,並強調預防勝於治療的觀念。藉由健康檢查的篩檢,一些疾病可能可以及早檢查出來,從而得到適當的治療。而本研究發現近年來癌症死亡人口有逐年上升趨勢,在國人癌症排行榜,大腸癌連3年蟬聯第一,大腸癌對國人的影響已經不容忽視。
本研究主是要以林義祥(2011)運用健檢資料建構大腸異常的預測模型為基礎,探討在使用類神經網路方法建構預測模型時,K=10的交互驗證及不同的類神經網路參數對預測結果的影響、探討不平衡資料對預測效能的影響、探討將高相關性健檢項目群組化與未群組化及大腸鏡檢查結果細分類是否影響大腸異常的預測效能。
針對大腸鏡檢查資料的平衡性問題,即針對大腸鏡檢查結果為佔正常與異常的樣本數比例,本研究發現,訓練樣本的正常/異常比例比測試樣本的正常/異常比例低時,預測模型的準確度較低。在使用高相關性健檢項目群組化與大腸鏡檢查結果分為正常與異常兩類的預測模型中,使用5疊交互驗證準確度會比10疊交互驗證優。當比較高相關性健檢項目群組與化未群組化兩種預測模型績效,高相關性健檢項目未群組化的模型準確度(59.68%)較群組化的(63.98%)低,由此可知群組化因子後的模型準確度會有所提升。
In recent years, people more and more pay attention to the health examination. The purpose of health examination aimed is to detect disease in the early stage. Screening by health examination , some diseases may be found early and receive proper treatment. From literature, it can be found that the mortality of cancer has increased in recent years. The mortality of colorectal cancer has in the first place among all other cancer diseases and cannot be ignored.
In this study, the health examination data from Yi-Siang Lin (2011) is applied to construct prediction model for colon abnormalities by using the neural network method. Cross validation of different K-fold are applied in the neural network models; different parameter settings are used to assess the performance of the predicted models; different imbalance sample data are used to assess the performance of the performance of the models; the impact of clustering the highly correlated health examination items to the model prediction are also evaluated.
In the study of imbalanced sample data, when the ratio of the observed data of normality/abnormality from the colonoscopy in the training sample is higher than that in the testing sample, it resulted in a lower accuracy of prediction. When the highly correlated health examination items are clustered and colonoscopy results are divided into two categories (normality/abnormailty), the accuracy of 5-fold cross-validation is better than 10-fold cross-validation. Finally, when the highly correlated health examination items are clustered, the accuracy of the model (63.98%) is better that of the model with no clustering (59.68%).
誌謝 I
摘要 II
ABSTRACT III
目錄 IV
圖目錄 VI
表目錄 VIII
第一章、緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
1.3 研究範圍及限制 4
1.4 論文架構 4
第二章、文獻探討 6
2.1 健康檢查介紹與相關研究 6
2.2 大腸異常介紹 9
2.2.1大腸鏡檢查相關介紹 9
2.3 運用資料探勘方法在大腸癌的相關研究 11
2.4 不平衡資料對預測模型的影響與處理 13
2.5 區別分析(Discriminate Analysis)的介紹與相關研究 16
2.6 類神經網路的介紹與相關文獻 18
2.7 K疊交互驗證法(K-fold Cross-validation) 24
2.8 績效評估方法之相關文獻與介紹 26
2.8.1 準確度、敏感度及特異度 26
2.8.2 ROC曲線檢定(Receiver Operating Characteristic) 28
2.8.3 績效方法之決定 29
第三章、研究方法 30
3.1 研究架構與流程 30
3.2 影響類神經網路預測效果的條件 31
3.3 資料前置處理 33
3.3.1 健檢資料 33
3.3.2 大腸鏡檢查資料 34
3.4 K疊交互驗證法(K-fold Cross-validation) 36
3.5 應用區別分析篩選重要健檢項目 38
3.6 應用類神經網路建構預測模型 39
3.7 預測模型的績效評估 40
第四章、個案分析與討論 41
4.1 考慮不平衡資料與不同參數之預測模型 41
4.2 考慮高相關性健檢項目群組化的預測模型 44
4.2.1 K疊交互驗證法(K-fold Cross-validation) 44
4.2.2 考慮高相關性健檢項目群組化之重要健檢項目篩選 45
4.2.3 類神經網路參數設定 46
4.2.4倒傳遞類神經網路預測模型 47
4.3 考慮高相關性健檢項目群組化與未群組化重要健檢項目之 模型建構 47
4.3.1 K疊交互驗證法(K-fold Cross-validation) 48
4.3.2 考慮高相關性健檢項目未群組化之重要健檢項目篩選 49
4.3.3考慮高相關性健檢項目群組化之重要健檢項目篩選 50
4.3.4 類神經網路參數設定 50
4.3.5 倒傳遞類神經網路預測模型 51
4.4 結果分析 52
第五章、結論與未來研究方向 55
5.1 結論 55
5.2 未來研究方向 57
參考文獻 59

圖目錄
圖1-1 研究流程圖 5
圖2-1 人工神經元模型示意圖 19
圖2-2 倒傳遞類神經網路連接模型 22
圖2- 3 ROC 曲線圖 28

表目錄
表2-1 健康檢查項目與內容說明 8
表2-2 應用檢康檢查作疾病探討之相關文獻彙整 8
表2-3 資料探勘方法應用於大腸異常之相關文獻彙整 13
表2-4 資料不平衡處理方法的相關文獻彙整 16
表2-5 類神經網路依學習策略之模式類型 20
表2-6 K疊交互驗證法相關文獻彙整 26
表2-7 績效評估相關文獻 27
表2-8 混淆矩陣 27
表3-1 中部某醫學中心所提共之健檢項目 33
表3-2 大腸鏡檢查結果分類 34
表3-3 健檢資料的量化處理彙整表 35
表3-4 交互驗證訓練樣本及測試樣本分群 36
表3-5 群組化的高相關性健檢項目一覽表 39
表4-1 不同的學習速率、訓練與測試樣本比例及10疊交叉驗證所得測試 模型的準確度與特異度 43
表4-2 高相關性健檢項目群組化最佳K疊劃分 44
表4-3 高相關性健檢項目群組化最佳K疊劃分 45
表4-4 應用逐步區別分析所篩選的重要健檢項目(或群組) 46
表4-5 高相關性健檢項目群組化在學習速率所得之預測準確度 47
表4-6 高相關性健檢項目群組化預測模型準確度與特異度 47
表4-7 高相關性健檢項目未群組化最佳K疊劃分 48
表4-8高相關性健檢項目未群組化最佳K疊劃分 49
表4-9 應用逐步區別分析所篩選的重要健檢項目 49
表4-10 應用逐步區別分析所篩選的重要健檢項目(或群組) 50
表4-11 高相關性健檢項目未群組化、群組化學習速率設定 51
表4-12 高相關性健檢項目群組化與未群組化預測模型準確度與特異度 52
1.王以晴。(2007) 。資料探勘大腸直腸癌存活分析模式之建構-類神經
網路與支援向量機之應用,輔仁大學,管理研究所碩士論文,台北市。

2.行政院衛生署中央健康保險局,網址:http://www.nhi.gov.tw/。

3.行政院衛生署台北醫院,網址:http://www.ptph.doh.gov.tw/。

4.李伏娥,葉紅軍,李堅,王俊萍,劉永革,余光銀,尹為華,(2005)796例大腸瘜肉的臨床、內鏡及病理觀察,中南大學學報(醫學版),30卷(4):463-466。

5.李逢嘉,(2010),特徵選取為基礎之複合分類預測模式-以信用資料為例,國立清華大學工業工程與工程管理學系,新竹市。

6.李語嫣。(2009),運用資料探勘技術由健康檢查與生活習慣資料建立疾病預測模型-以糖尿病為例,國立成功大學,醫學資訊研究所碩士論文,台南市。

7.周文賢,(2002),多變量統計分析,智勝文化出版,台北市。

8.林佳蒨,(2012),支援向量機於不平衡資料類別問題之應用,國立暨南國際大學,資訊管理學系碩士論文,南投縣。

9.林承翰,(2005),在不平衡的資料中改進少數類別分類正確率的方法之研究,輔仁大學,資訊工程學系碩士論文,台北市。

10.林義祥,(2011),運用健檢資料建構大腸癌預測模型,朝陽科技大學,工業工程與管理研究所論文,台中市。

11.林裕森,(2011),運用不同階段檢驗項目建構急性腎衰竭病患之預後模型,朝陽科技大學,工業工程與管理研究所論文,台中市。

12.馬偕紀念醫院,網址http://www.mmh.org.tw/index_big5.html。

13.高仲仁,(2001),運用類神經網路進行隧道沿體分類。國立中央大學應用地質研究所論文,桃園縣。

14.張昭威,(2010),運用資料探勘方法建構乳癌預後模式,朝陽科技大學,工業工程與管理研究所論文,台中市。

15.張琦、吳斌、王柏,(2005),非平衡數據訓練方法概述,計算機科學,第三二卷,第十期,第181-186頁。
16.郭儀昌,(2011),應用資料探勘於面板光阻膜厚診斷之研究,國立高雄第一科技大學,資訊管理研究所碩士論文,高雄市。

17.陳心懋,(2009),結合集群分析於不平衡資料之分類預測方法,銘傳大學,資訊工程系碩士論文,台北市。

18.陳弘聖,(2011),空腹血糖異常與慢性腎臟病風險之探討-以中部海線地區某區域教學醫院成人健檢資料分析,東海大學,工業工程與經營資訊學系論文,台中市。

19.陳志達,(2012),運用多變量分析探討大腸異常之重要相關健檢項目,朝陽科技大學工業工程與管理研究所論文,台中市。

20.陳怡婷,(2011),應用資料探勘技術於血液透析動靜脈瘻管阻塞因子之研究,雲林科技大學,工業工程與管理研究所碩士班論文,雲林縣。

21.陳維熊,魏承生,(2008),中西醫診-大腸癌,書泉書局出版,台北市,中華民國。

22.陳耀茂、殷純淵,(2004),類神經網路 PCNeuron 使用手冊,鼎茂圖書,臺北市。

23.曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯,(2005),資料探勘,旗標出版,臺北市。

24.游雅雯,(2008),建構大腸鏡異常發現之預測模型,雲林科技大學,工業工程與管理所碩士論文,雲林縣。

25.黃上益,(2007),運用資料探勘技術於動脈粥狀硬化預測模式之研究,虎尾科技大學,工業工程與管理研究所論文,雲林縣。

26.黃志暉,(2004),臺東地區主要競爭醫院忠誠病人之區辨研究,高雄醫學大學,公共衛生學研究所碩士在職專班論文,高雄市。

27.黃椒筠,(2008),資料探勘技術於結直腸癌患者分類模型之建構,國防醫學院,公共衛生學研究所碩士論文,台北市。

28.葉怡成,(2000),類神經網路模式應用與實作,儒林圖書,台北市。

29.廖玉貴,(2008),中老年人高血壓、高血糖、高血脂危險因子之探討:以屏東某區域教學醫院健檢中心為例,美和技術學院,健康照護研究所論文,屏東縣。

30.趙建剛,(2004),失智症預測模式之研究,義守大學,管理研究所論文,高雄市。

31.趙堡蕓,(2010),代謝症候群盛行率與影響因子初探-以台中市某區域醫院健檢者為例,中臺科技大學,醫護管理所論文,台中市。

32.蔡東穎,(2011),以健檢資料為基礎之缺血性中風預測模型探討,國立陽明大學,生物醫學資訊研究所論文,台北市。

33.羅隆晉,(2010),以集群為基礎之多分類器模型對不平衡資料預測之研究,銘傳大學,資訊工程系碩士論文,台北市。

34.Delen, D., Walker, G., and Kadam, A., (2005) "Predicting breast cancer survivability: a comparison of three data mining methods", Artificial Intelligence in Medicine, 34:113-127.

35.Kim, K.J., and Cho, S.B., (2004) "Prediction of colon cancer using an evolutionary neural network", Neurocomputing, 61:361-379.

36.Kohavi, R., (1995) "A study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection", Appears in the International Joint Conference on Artificial Intelligence(LJCAI), pp.1137-1145.

37.Li, L., Tang, H., Wu, Z., Gong, J., Gruidl, M., Zou, J., Tockman, M.,Clark, R.A., (2004) "Data mining techniques for cancer detection using serum proteomic profiling", Artificial Intelligence in Medicine, 32:71-83.

38.Lin, S.W. and Shih, C.C. (2009) "PSOLDA: A particle swarm optimization approach for enhancing classification accuracy rate of linear discriminant analysis", Applied Soft Computing, 9:1008-1015.

39.Ping, X., Guy, N.B., Rudolph, S.P., (2009) "Modified linear discriminant analysis approaches for classification of high-dimensional microarray data", Computational Statistics &; Data Analysis, 53:1674-1687.

40.Kohavi, R., (1995) "A study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection", Appears in the International Joint Conference on Artificial Intelligence (L
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊