(3.215.183.251) 您好!臺灣時間:2021/04/22 23:15
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:孫詠涵
研究生(外文):Yung-Han Sun
論文名稱:建立食道癌病理報告癌症自動分期之預測模型
論文名稱(外文):An Automatic Staging Classification Model for Esophageal Cancer Pathological Reports
指導教授:陳春賢陳春賢引用關係
指導教授(外文):C. H. Chen
學位類別:碩士
校院名稱:長庚大學
系所名稱:管理學院碩士學位學程在職專班資訊管理組
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2010
畢業學年度:99
論文頁數:119
中文關鍵詞:癌症分期文件分類食道癌病理報告
外文關鍵詞:cancer stagingdocument classificationesophageal pathological report
相關次數:
  • 被引用被引用:0
  • 點閱點閱:248
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
根據衛生署的統計,2009年臺灣地區有超過40000人死於癌症。而由於過去十年醫學經驗和知識的進步,使得癌症的預後有明顯的改善,即使對於相對晚期的癌症病患也有新的藥物和治療方式來改善其預後。癌症分期是評估治療效果和預後的重要因子,然而其準確性會受癌登中心工作人員判讀病患病理報告的熟練度所影響,而且人工判讀過程往往是耗時且效率不彰的。因此本研究的目的是使用文件分類技術自動化的將食道癌的病理報告轉換為癌症分期報告並評估其效能。在本研究中,共收集了從2000到2008年在北部某醫學中心胸腔外科的234個接受食道切除的病患,利用文字探勘技術去分析報告中的癌症分期關鍵字加權後再以電腦轉換,然後再用J48決策樹分析規則來評估本研究的文件分類模型的效能。在本研究的結果中顯示對於細胞型態的平均預測準確率可達95.74%,而對於分期中的重要因子,T、N、M的平均預測準確率可分別達到86.14%、90.73%和94.89%。因此本研究的結論為使用文件分類技術和J48決策樹分析規則對於食道癌病理報告分期轉換的準確率是相當高的,此模型可以有效率的幫助醫師或是癌登中心工作人員改善癌症病理分期的準確率及降低大量數據研究下所需的時間。
More than 40,000 Taiwan residents died of cancers in 2009 according to the statistics of Department of Health, Taiwan. Due to the advance in medical experience and knowledge over the last decade, the prognosis of cancer patients has been significantly improved and there are more drugs as well as alternative treatments to help patients at relatively late stage of cancers. Cancer staging is an important indicator for assessing the effects of cancer treatment and prognosis. Its effectiveness may be affected by the interpretation proficiency of cancer registration staff who read the pathological reports of cancer patients. However, the manual interpretation process is somewhat inefficient and time consuming. The aim of this study was to explore the effectiveness of computationally converting pathological reports of esophageal cancer into cancer staging reports by using efficient document classification techniques. Materials and Methods: Pathological reports of 234 patients undergone esophagectomy from year 2000 to 2008 in Division of Thoracic Surgery, Taipei-Veterans General Hospital, Taiwan were collected in this study. The reports were computationally converted into weighted frequency vectors of keywords by using text mining techniques to analyze cancer staging related keywords in the reports. Then, J48 decision tree induction algorithm, a supervised learning algorithm, was used to evaluate the performance of our document classification model for automatic cancer staging based on the 234 vectors. Results: The average prediction accuracy rate for cell type reaches 95.74%, and those for T, N and M status reach 86.14%, 90.73% and 94.89% respectively. Conclusions: In esophageal cancer, using the J48 decision tree induction algorithm, the average prediction accuracy rate is high, the model may efficiently and effectively assist the physicians or cancer registration staffs to improve the accuracy rate of cancer pathological stage and reduce the time-consuming stage in the large number of data processing in studies.
目錄
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 10
1.3 研究限制 10
1.4 論文架構 10
第二章 文獻探討 12
2.1 食道癌 12
2.2 癌症的分期 15
2.2.1 TNM分期系統 15
2.2.2醫學上常見的分期種類 17
2.2.3 AJCC分期相關研究文獻回顧 18
2.2.4 國內常見的癌症分期方式 20
2.3 食道癌之分期 22
2.4 文字探勘技術回顧 26
2.4.1定義 26
2.4.2文字探勘流程 26
2.4.3文字探勘方法 28
2.5 文件分類技術 29
2.6 文字探勘應用於生醫的研究 33
2.7 病理報告格式 34
第三章 研究方法 36
3.1 研究流程 36
3.2 文字探勘 37
3.3 分類模型的建立與預測 47
3.3.1選用軟體 47
3.3.2資料訓練及測試 48
3.3.3進行文字探勘 48
3.4 分析與評估實驗 48
3.5 病理報告運用方式 49
3.6 文件自動分類效能評估 50
第四章 研究結果 54
4.1 細胞類型(Cell Type)之模型建立與預測 54
4.2 腫瘤大小(T)之模型建立與預測 59
4.3 淋巴結轉移(N)之模型建立與預測 67
4.4 遠處轉移(M)之模型建立與預測 75
4.5 評估效能 79
第五章 研究結論與未來研究方向 92
5.1 研究討論 92
5.1.1細胞類型預測不符的原因 92
5.1.2腫瘤大小之加權比重 93
5.1.3選擇淋巴結轉移和遠處轉移陽性值的理由 93
5.2 研究結論 94
5.3 未來研究方向 95
參考文獻 96
中文 96
英文 97
網站 100
附錄 101


圖目錄
圖2-1 文字探勘流程……………………………………………………27
圖3-1 研究流程…………………………………………………………37
圖3-2 以Weka J48 test option 選擇percentage split 66%………………49
圖4-1 Weka之細胞類型分類共10個欄位屬性…………………………57
圖4-2 以Hold-out method進行訓練模型………………………………58
圖4-3 細胞類型(Cell Type)之決策樹…………………………………58
圖4-4 細胞類型(Cell Type)之預測率…………………………………59
圖4-5 腫瘤大小自動分類未加權之決策樹圖…………………………63
圖4-6 腫瘤大小自動分類未加權之預測率……………………………64
圖4-7 腫瘤大小自動分類加權後之決策樹圖…………………………65
圖4-8 腫瘤大小自動分類加權後之預測率……………………………66
圖4-9 淋巴結轉移自動分類之決策樹圖………………………………73
圖4-10 淋巴結轉移自動分類之預測率…………………………………74
圖4-11 淋巴結轉移人工分類之預測率…………………………………74
圖4-12 Weka之遠處轉移(M)分類共27個屬性…………………………76
圖4-13 遠處轉移自動分類之決策樹圖…………………………………77
圖4-14 遠處轉移自動分類之預測率……………………………………78
圖4-15 依據細胞類型訓練模型以Hold-out method隨機取樣10次之預測率………………………………………………………………………79
圖4-16 依據細胞類型訓練模型以5-fold cross-validation隨機取樣10次之預測率…………………………………………………………………80
圖4-17 依據細胞類型訓練模型以10-fold cross-validation隨機取樣10次之預測率………………………………………………………………81
圖4-18 依據腫瘤大小訓練模型以Hold-out method隨機取樣10次之預測率………………………………………………………………………82
圖4-19 依據腫瘤大小訓練模型以5-fold cross-validation隨機取樣10次之預測率…………………………………………………………………83
圖4-20 依據腫瘤大小訓練模型以10-fold cross-validation隨機取樣10次之預測率………………………………………………………………84
圖4-21 依據淋巴結轉移訓練模型以Hold-out method隨機取樣10次之預測率……………………………………………………………………85
圖4-22 依據淋巴結轉移訓練模型以5-fold cross-validation隨機取樣10次之預測率………………………………………………………………86
圖4-23 依據淋巴結轉移訓練模型以10-fold cross-validation隨機取樣10次之預測率………………………………………………………………87
圖4-24 依據遠處轉移訓練模型以Hold-out method隨機取樣10次之預測率………………………………………………………………………88
圖4-25 依據遠處轉移訓練模型以5-fold cross-validation隨機取樣10次之預測率…………………………………………………………………89
圖4-26 依據遠處轉移訓練模型以10-fold cross-validation隨機取樣10次之預測率………………………………………………………………90


中文
1. 丁一賢,陳牧言,《資料探勘》,滄海書局,頁99~130。
2. 江支銘,〈直腸癌手術治療之現況〉,《中華癌醫會誌》,第24卷第3期,頁167~171,2008年6月。
3. 李御璽,顏秀珍,陳信希,劉又誠,〈從生醫資料庫中探勘基因表達證據之研究〉,《 2005年 NCS 全國計算機會議》,2006年10月。
4. 周嘉揚,〈肝切除治療肝細胞癌〉,《中華癌醫會誌》,第24卷第5期,頁311~317,2008年10月。
5. 周志銘,《希望之路~面對食道癌》,中華民國癌症希望協會,五版,2009年4月。
6. 洪淑芬,〈潛在語意索引在生醫文件分類之應用〉,樹德科技大學,碩士論文,2006年6月。
7. 洪景男,曾文盛,陳培展,陳彥廷,〈癌症登記即時統計分析系統之建立〉,《中華放射線醫學雜誌》,第31卷第1期,頁29~34,2006年2月。
8. 孫章唐,謝天渝,陳俊明,陳毓雯,陳中和,〈口腔鱗狀細胞癌患者前哨淋巴結偵測與頸部淋巴轉移分析〉,《中華民國口腔顎面外科學會雜誌》,第18卷第1期,頁1~8,2007年3月。
9. 曾元顯,〈應用於資訊檢索的中文OCR錯誤詞彙自動更正〉,《中國圖書館學會會報》,第72期,頁23~31,2004年6月。
10. 許懷仁,〈生物醫學文件探勘系統之架構設計與實作〉,國立成功大學,碩士論文,2002年7月。
11. 楊正銘,〈以文字探勘技術應用於疾病分類之輔助系統-以出入院病歷摘要為例〉,台北醫學大學,碩士論文,2004年6月。
12. 劉威辰,〈臺灣地區癌症病患使用醫療費用及其財務保障之探討〉,亞洲大學,碩士論文,2006年6月。
13. 盧勝男,〈肝細胞癌之臨床分期〉,《中華癌醫會誌》,第24卷第5期,頁295~303,2008年10月。
14. 顧憶珍,〈自動處理病理報告以分類腦瘤個案〉,國立陽明大學,碩士論文,2009年10月。
英文
1. Arminger G, Enache D, Bonne T. Analyzing Credit Risk Data: A Comparison of Logistic Discrimination Classification Tree Analysis and Feedforward Networks. Computational Statistics 12: 293-310. Mar 26, 1997
2. Dörre J, Gerstl P, Seiffert R. Text Mining: Finding Nuggets in Mountains of Textual Data. In: Chaudhuri S, Madigan D editors. KDD ’99 Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining. New York, NY: Assn for Computing Machinery, 1999
3. Frank E, Hall M, Holmes G, Kirkby R, Pfahringer B, Witten IH, et al. Weka - a machine learning workbench for data mining. In: Maimon O, Rokach L editors. The Data Mining and Knowledge Discovery Handbook. 2nd ed. New York, NY: Springer; 2005
4. Falk PM, Gupta NC, Thorson AG, Frick MP, Boman BM, Christensen MA, Blatchford GJ. Positron emission tomography for preoperative staging of colorectal carcinoma. Dis Colon Rectum 37(2): 153-6, 1994 Feb.
5. Joyce DL, Wahl RL, Patel PV, Schulick RD, Gearhart SL, Choti MA. Preoperative Positron Emission Tomography to Evaluate Potentially Resectable Hepatic Colorectal Metastases. Arch Surg 141(12): 1220-6, 2006 Dec.
6. Greene FL, Page DL, Fleming ID, Fritz A, Balch CM, Haller DG, Morrow M. AJCC Cancer Staging Manual 6th ed. New York, NY: Springer, 2002
7. Hsieh CC, Chien CW. A cost benefit study of esophagectomy for patients with esophageal cancer. J Gastrointest Surg 13(10): 1806-12, 2009 Oct.
8. Lu SN, Yen YH, Lin CY, Kee KM, Wang JH, ChangChien CS. Clinical Staging of Hepatocellular Carcinoma. J Chinese Oncol Soc 24(5): 295-303, 2008
9. Mitchell TM. Decision Tree Learning. In: Machine Learning. Boston, MA: McGraw-Hill, pages 52-9, 1997
10. Okuda K, Ohtsuki T, Obata H, Tomimatsu M, Okazaki N, Hasegawa H, Nakajima Y, Ohnishi K. Natural history of hepato-cellullar carcinoma Portale G, Hagen JA, Peters JH, Chan LS, DeMeester SR, Gandamihardja TA, DeMeester TR. Modern 5-Year Survival of Resectable Esophageal Adenocarcinoma : Single Institution Experience with 263 Patients . J Am Coll Surg 202(4): 588-96, 2006 Apr.
11. Portale G, Hagen JA, Peters JH, Chan LS, DeMeester SR, Gandamihardja TA, DeMeester TR. Modern 5-Year Survival of Resectable Esophageal Adenocarcinoma : Single Institution Experience with 263 Patients . J Am Coll Surg 202(4): 588-96, 2006 Apr.
12. Quinlan JR. Induction of decision trees. Machine Learning 1(1): 81-106, 1986
13. Quinlan JR. C4.5: Programs for Machine Learning. San Mateo, CA: Morgan-Kaufmann, 1992
14. Salton G. Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Wokingham, MA: Addison-Wesley, 1988
15. Shatkay H, Edwards S, Boguski M. Information retrieval meets gene analysis. IEEE Intelligent Systems, Special Issue on Intelligent Systems in Biology 17(2): 45-53, 2002
16. Sullivan D. Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing, and Sales. New York, NY: John Wiley & Sons, 2001
17. Rice TW, Blackstone EH, Rybicki LA, Adelstein DJ, Murthy SC, DeCamp MM, Goldblum JR. Refining esophageal cancer staging. J Thorac Cardiovasc Surg 125: 1103-13, 2003
18. Yeh YM, Chen YP, Wu HC, Su WC. Combined Small Cell Carcinoma and Adenocarcinoma of Lung. J Chinese Oncol Soc 24(6): 380-5, 2008
網站
1. 行政院衛生署網站,全國主要死亡原因,http://www.doh.gov.tw/CHT2006/Display StatisticFile.aspx?d=71701&s=1/, 2009/8/4,網站存取時間2009/9/1
2. American Joint Committee on Cancer(AJCC), What is Cancer Staging? http://www.cancerstaging.org/mission/whatis.html/,2006/7/26,網站存取時間2009/9/1
3. Weka software. http://www.cs.waikato.ac.nz/ml/weka/,網站存取時間2010/3/1
4. 葉乃菁,建構創新政策研究工具—文字探勘之應用簡介,http://www.narl.org.tw/tw/topic/list.php?topic_class_id=21/,2009/7/1,網站存取時間2009/8/17

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔