跳到主要內容

臺灣博碩士論文加值系統

(44.192.22.242) 您好!臺灣時間:2021/08/05 11:43
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳靜怡
研究生(外文):Jean-yi Chen
論文名稱:醫療支出虛報偵測模型之建立-資料探勘於台灣全民健康保險糖尿病資料庫之應用
論文名稱(外文):Using Data Mining Techniques to Detect Hospital Fraud and Abuse on Claims for Diabetic Medical care
指導教授:劉芬美劉芬美引用關係
指導教授(外文):Fen-May Liou
學位類別:碩士
校院名稱:元培科學技術學院
系所名稱:經營管理研究所
學門:商業及管理學門
學類:企業管理學類
論文種類:學術論文
論文出版年:2007
畢業學年度:96
語文別:中文
論文頁數:96
中文關鍵詞:全民健保醫療詐欺資料採礦預測
外文關鍵詞:National Health InsuranceMedical insurance fraudpredictionData-mining
相關次數:
  • 被引用被引用:1
  • 點閱點閱:253
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
摘 要
本研究運用資料探礦技術,依據台灣全民健康保險資料庫的資料型態,為糖尿病醫療支出建立虛報偵測模型。本研究依據糖尿病及全民健保支出相關研究,選取潛在偵測變數,鑒於羅吉斯迴歸具有依據個體之特性預測及歸類其健康狀況之功能,為醫療領域常用的研究方法,故採用羅吉斯演算法之資料採礦技術,作為建立偵測模型之方法。本研究另運用類神經網路、決策樹演算法建立偵測模型與羅吉斯模型相互比較。結果顯示,三種模型偵測違約醫療院所之正確率均達100%,惟就整體正確率而言,決策樹(99%)高於類神經網路(96%)及羅吉斯(92%)。
Abstract
This research uses on the comprehensive National Health Insurance (NHI) Research Database offered by the Bureau of National Health Insurance (BNHI) of Taiwan. This paper collects longitudinal data from diabetic ambulatory service in 2003. Based on the diabetes-mellitus and insurance expenditure previous studies, the studies selected potential variables with reference to Logistic regression, which is ranked second on prediction accuracy among 32 classification algorithms (Lim, Loh and Shih, 2000). The assumed a major position in the healthcare field as a method for predicting or classifying health outcomes based on the specific characteristics of each individual case (Chae et al., 2001). Therefore, the research aims building a data-mining model by Logistic Regression, Neural Network and Classification Tree algorithm for detecting fraudulent healthcare claims and compared three algorithm difference form diabetes of Taiwan. The results shows fraud detection models have 100%, the whole accurate rate showed the prediction models established by Classification Tree model (99%) better than neural networks (96%) and then Logistic model (92%).
目 錄
頁次
致謝 I
中文摘要 II
英文摘要 III
目錄 IV
圖目錄 VI
表目錄 VIII
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目的 3
1.3 研究流程 5
1.3 研究架構 6
第二章 文獻探討 7
2.1 台灣醫療保健資源與特性 7
2.1.1全民健康保險計畫 7
2.1.2 糖尿病的醫療保健特性 10
2.2 醫療行為與健保財務狀況 14
2.2.1健保制度與醫療行為 14
2.2.2 健保制度之審查作業 16
2.2.3 健保制度之困境 18
2.2.4 醫療異常案件之稽核 19
2.2.5 醫療資源浪費的影響 22
2.3資料採礦的定義與類型 24
2.3.1 採礦的定義 24
2.3.2 採礦的功能 24
2.3.3 採礦的步驟 25
2.3.4 資料採礦的技術 26
2.3.5 資料採礦在醫療產業的相關應用 29
第三章 研究設計與模式建構 32
3.1研究設備及工具 32
3.2研究架構 34
3.3資料來源 35
3.3.1 全民健康保險資料庫 35
3.3.2 資料範圍選擇與資料轉換 37
3.4分析方法與採礦模型之建構 40
3.4.1 描述性統計 41
3.4.2 資料採礦模型應用 41
第四章 實證研究 61
4.1描述性統計 62
4.2 資料採礦分析 63
4.2.1 羅吉斯演算法 64
4.2.2 類神經演算法 66
4.2.3 決策樹演算法 67
4.2.4 三種演算法模型結果之比較 69
第五章 結論與建議 70
參考文獻 72
附錄一 糖尿病的類型 79
附錄二 健保局對異常案件的審查程序 82
附錄三 糖尿病相關併發症之ICD9 CODE 83
附錄四 2003年全民健康保險學術研究資料庫-全國就醫資料 86
附錄五 醫事機構基本資料檔 87
附錄六 門診處方及治療明細檔 90
附錄七 分類決策樹之規則集 96

圖 目 錄
頁次
圖1-1 研究流程 6
圖2-1 中央健康保險局醫療院所民眾關係示意圖 8
圖2-2 2001-2003年糖尿病在醫療成本花費的比率 13
圖2-3 健保財務收支關係圖 16
圖2-4 醫療費用審查流程圖 18
圖2-5 資料採礦流程圖 26
圖2-6 資料探勘的過程 28
圖2-7 資料挖掘技術的分類 28
圖3-1 研究架構 34
圖3-2 資料關聯圖 37
圖3-3 醫事機構基本檔轉換成SPSS檔案格式畫面 39
圖3-4 轉換後SPSS檔案內容畫面 40
圖3-5 類神經網絡架構 44
圖3-6 Logistic regression Simple 模式選項畫面 53
圖3-7 Logistic regression Expert 模式選項畫面 54
圖3-8 Logistic regression Convergence模式選項畫面 55
圖3-9 Logistic regression output模式選項畫面 55
圖3-10 Neural Net Simple 模式選項畫面 56
圖3-11 Neural Net Expert 模式選項畫面 57
圖3-12 決策樹架構圖 58
圖3-13 C5.0 Simple 模式選項畫面 58
圖3-14 C5.0 Expert 模式選項畫面 59
圖4-1 資料採礦流程圖 64























表 目 錄
頁次
表2-1 全民健保醫療費用申報金額期間為1995-2003 9
表2-2 2003年門診服務和住院病患之平均成本費用 10
表2-3 糖尿病的年費用成長 11
表2-4 糖尿病患在不同的醫院類型的年費用增長情形 11
表2-5 資料採礦的功能 25
表2-6 資料挖掘常用的技術 27
表2-7 國內學者將資料採礦方法運在健保醫療費用審查之相關文獻 30
表2-8 國外學者將資料採礦方法運在健保醫療費用審查之相關文獻 31
表3-1 轉出資料檔欄位表 35
表3-2 醫事機構基本資料檔 36
表3-3 門診處方及治療明細檔 36
表3-4 資料轉換過程畫面整理說明表 39
表3-5 決策樹的分類 52
表4-1 醫療費用指標的選取與來源 61
表4-2 病患就醫次數-按地區分 62
表4-3 醫療機構分佈 62
表4-4 病患就醫利用-依地區別與院所型態分 63
表4-5 一般及違約醫療機構費用指標比較 63
表4-6 逐步羅吉斯迴歸檢定結果 66
表4-7 羅吉斯模型之預測結果 66
表4-8 類神經模型之預測結果 67
表4-9 決策樹模型之預測結果 68
ㄧ、英文部份
1.A. Berson, S. Smith, and K. Thearling, “CRM Data Mining: Build Data Mining Application for CRM,” McGraw-Hill inc., 2000.
2.Abraham, T. Roddick, J.F. “Opportunities for knowledge discovery in spatio-temproal information systems,” Australian Journal of Information Systems, Vol. 5, No. 2, 1998, pp. 3-12.
3.Adam, N.R., O. Dogramci, A. Gangopadhyay, Y. Yesha. Electric Commerce: Technical, Business and Legal Issues. New Jersey: Prentice-Hall, 1998.
4.Aday, L.A. and Andersen, R.M., "A Framework for the Study of Access to Medical Care," Health Services Research, Vol. 9, 1974, pp.208-220.
5.Agresti, A, ”An Introduction to Categorical Data Analysis,” Wiely Series in Probability and Statistics, 1996.
6.Berry, M.J.A. and Linoff, G., Data Mining Technique for Marketing, Sale, and Customer Support, Wiley Computer, 1997.
7.Borok, Lawrence.S. “Data mining: Sophisticated forms of managed care modeling through artificial intelligence. Journal of Health Care Finance ,Vol. 23, No. 3, 1997, pp.20-36.
8.Breault, Joseph L., Colin R. Goodall Peter J. Fos. “Data mining a diabetic data warehouse.” Artificial Intelligence in Medicine Vol. 26, 2002, pp.37-54.
9.Breiman, L., Friedman, J.H., Olshen , R.A. and Stone,C.J., Classification and Regression Trees, Wadsworth Belmont. Wadsworth International Group, Monterey, CA, 1984.
10.Cabena, P., P. Hadjinlan and R. Stadler etc., “Discovering Data Mining From Concept to Implementation,” Prentice-Hall, Inc., 1998, pp.41-59.
11.Cabena P, Hadjinian P, Stadler R, Verhees J, Zanasi A. Data Mining from Concept to Implementation. 1997, Prentice-Hall: Englewood Cliffs, NJ.
12.Chae, Young Moon, Seung Hee Ho, Kyoung Won Cho Dong Ha Lee. “Data mining approach to policy analysis in a health insurance domain.” Medical Informatics Vol. 62, 2001, pp.103-111.
13.Chang, Le-Xin. Ownership and Hospital Behaviors. Unpublished Doctorial Dissertation, Taipei: National Taiwan University,2004.
14.Chen, Ming-Chung. Effects of physician affiliation on utilization of medical resources: A study of diabetes mellitus outpatients. Unpublished Master Thesis, Taiepi: National Yang-Ming University,2001.
15.Cox, D. R. and Snell, E. J. (1989) ”Analysis of Binary Data, Second Edition”, London: Chapman and Hall.
16.Davidson, G.S., Hendickson, B., Johnson, D.K., Meyers, C.E. and Wylie, B.N. “Knowledge mining with VxInsight: Discovery through interaction. Journal of Intelligent Information Systems: Integrating Artificial Intelligence and Database Technolobies, Vol. 11, No. 3, 1999, pp.259-285.
17.Egunjobi, L., “Factors Influcing Choice of Hospitals: a Case Study of the Northern Part of Oyo State, Nigeria,” Social Science and Medicine, Vol. 17, No. 9, 1983, pp.585-589.
18.Fixed Roles and Nurturant Roles,” Social Science and Medicine, Vol. 19, No. 2, 1984, pp.77-91.
19.Folland, Sherman; Goodman, Allen C; Stano, Miron, The Economics of Health and Health Care, NY: Macmillan publishing Company, 1993.
20.Forgionne, Guisseppi A., Aryya Gangopadhyay Monica Adya, “ Data mining system to detect healthcare fraud.” In (ed. Idea Group Publishing) Healthcare information systems: challenges of the new millennium. Hershey, PA: Idea Group Publishing, 2000.
21.Goddard, J. Lopez, I., Rufiner, H.L., “Improving the classification accuracy of cardiac patients,” Engineering in Medicine and Biology society, vol.5, 1996, pp.2018-2019.
22.Kass,G.V, “An Exploratory Technique For Investigating Large Quantities Of Categorical Data,” Applied Statistics, Vol.29, No.2, 1980, pp.119-127.
23.Hand, K.J., H. Mannila and P. Smyth, Principles of data mining. Cambridge, MA: MIT Press, 2001, pp. 343-347.
24.Haykin, S., Neural Network – A Comprehensive Foundation, Macmillan College Pub. Co., 1994.
25.Health Insurance Association of America, Update Source Bood of Health Insurance Data, 1993.
26.Heischmidt, K.A., ”A Multivariate Analysis of Choice Criteria for Hospitals,” Journal of Hospital Marketing, Vol. 8, No. 1, 1993, pp.41-54.
27.Horn, K.A. , Compton, P., Lazarusl L., and Quinlan J.R., “An Expert system for theinterpretation of thyroid assays in a clinical laboratory” , The Australian Computer Journal, Vol.17 , No.1 , 1986, pp.7-11.

28.Horton, C.F., “Women Have Headache, Men Have Backache: Patterns of Illness in an Appalachian Community,” Social Science and Medicine, Vol. 19, No. 6, 1984, pp.647-654.
29.Hunt E. B., J Marin, and P. J Stone, “Experiments in Induction ,” Academic Press, New York, 1996.
30.Hush, D.R., J. M. Salas, and B. Horne, “Error surfaces for milti-layer perceptrons,” IEEE Transations on Systems, Man and Cybernetics, Vol. 22, No. 5, 1992.
31.Information Discovery, Inc. A characterization of data mining technologies and processes: an Information Discovery, Inc. White Paper. http://www.dmreview.com/
32.Jencks, Stephen F; Schieber, George J, “Containing U.S. Health Care Cost: What Bullet to Bite?”, Health Care Financing Review, 1991
33.Koh, Hian Chye Gerald Tan, “Data mining applications in healthcare.” Journal of Healthcare Information Management ,Vol. 19, No. 2, 2005, pp.54-72.
34.Kum, H. C., Duncan, D., Flair, K. Wang, W. “Social welfare program administration and evaluation and policy analysis using knowledge discovery and data mining (kdd) on administrative data.” in Proceedings of the NSF National Conference on Digital Government Research (DG.O)’, 2003, pp. 39-44.
35.Lim Tjen-Sien, Wei-Yin Loh Yu-Shan Shih, “A comparison of prediction accuracy, complexity, and training time of thirty-three old and new classification algorithms.” Machine Learning ,Vol. 40, 2000, pp.203-229.
36.Lian, Choong Poh, Silva, C.J.S., “A comparison of maximum entropy estimation and multivariate logistic regression in the prediction of axillary lymph node,” IEEE Internation Conference on Nural Networks, vol.3, 1996, pp.1468-1473.
37.Limb, P.R. Meggs, G.J. “Data mining-tools and techniques.” British Telecom Technology Journal , Vol. 12, No. 4, 1995, pp.32-41.
38.Liu, Wei-Lun, An integrated model of data analysis and knowledge discovery for the expense control and management of national health insurance. Unpublished Master Thesis. Tao Yuan, Taiwan: Yuan: Chi University, 2001.
39.Logminiene Z,Norkus A,Valius L.: Direct and indirectdiabetes costs in the world.Medicina (Kaunas). Vol. 40, No. 1, 2004, pp.16-26.
40.Loh, Wei-Yin Yu-Shan Shih,“Split selection methods for classification trees.” Statistica Sinica, Vol. 7, 1997, pp.815-840.
41.Megaputer(2002)。Medical Fraud Detection Through Data Mining。www.megaputer.com
42.Milley, A. “Healthcare and data mining.” Health Management Technology, Vol. 21, No. 8, 2000, pp.44-47.
43.Odom,M.D.,and R.Sharda,1990,”A Neural Network Model for Bankruptcy Prediction”, Proceddings of the IEEE International Conference on Neural Networks,p11163-11168.San Diego,CA,USA.
44.Pankratz, A., Forecasting with Univariate Box-Jenkins Models – Conecpts and Cases, John Wiley Sons, Inc., New York, 1983.
45.Phelps, Charles E., Health Economics, NY: Harper Collins Publishers Inc, 1992.
46.Quinlan J.Ross., C4.5: Programs for machine learning, 1993, Morgan Kaufmann Publishers. , San Mateo, CA, 1993.
47.Quinlan J.Ross., “Induction of decision trees,” Machine Learning, Vol.1, 1986, pp.81-106.
48.Rao, R.B., Sandilya, s., Niculescu, R.S., Germond, C. Rao, H. “Clinical and financial outcomes analysis with existing hospital patient records,” in Proceeding of the ninth ACM SIGKDD international conference on knowledge discovery and data mining, 2003, pp. 416-425.
49.SPSS, http://www.sinter.com.tw/spss/index.htm
50.Tam,K.Y., and M.Y.Kiang, “Managerial Application of Neural Networks:The Case of Bank Failure Predictions.” Management Science,Vol.38, No.7, 1992, pp.926-947.
51.Tomes, J.P. Healthcare fraud, waste, abuse, and safe harbors: The complete legal guide. Chicago, Illinois: Probus Publishing Company, 1993.
52.Turban, E., McLean, E., and Wetherbe, J., Information Technology for Management, John Willy Sons. Inc., 1999.
53.Walter, R.G., “Gerder Differences in Mental and Physical Illness: the Effect of Fixed Roles and Nurturant Roles,” Social Science and Medicine, Vol.19, No.2, 1984, pp.77-91.
54.Yang W.S., Hwang S.Y., “A process-mining framework for the detection of healthcare fraud and abuse,” Expert Systems with Applications Vol. 31, 2006, pp.56–68
55.Widrow, B., Rumelhart, D.E., and Lehr, M.A., “Neural Networks: Applications in Industry, Business and Science,” Communications of the ACM, (37:3), 1994, pp.93-105.
56.Wilson, R.L. and Sharda, R., "Bankruptcy Prediction Using Neural Networks," Decision Support Systems, vol.11, No.5, 1994, pp.545-557.
57.Wu, J.K., Neural Networks and Simulation Methods, Marcel Dekker, Inc., New York, 1994.
58.Young Moon Chae, Seung Hee Ho, Kyoung Won Cho, Dong Ha Lee Sun Ha Ji, “Data mining approach to policy analysis in a health insurance domain,” International Journal of Medical Informatics, vol.62, 2001, pp.103-111.
59.Zhang, G.., B. E. Patuwo and M. Y. Hu, “Forecasting with Artificial Neural Networks: The State of the Art,” International Journal of Forecasting, vol.14, No.1, 1998, pp35-62.

二、中文部分
1.ICD-9-CM,國際疾病分類書,2002年。
2.中央健康保險局,全民健康保險統計,2002-2005年。
3.行政院衛生署,衛生統計資訊網,2002-2005年。
4.行政院衛生署﹔中華民國統計年鑑93 年版http://www.gov.tw/EBOOKS/TWANNUAL/show_book.php/path=3_008_020,2003 e-paper, October 24, 2005.
5.行政院內政部主計處,中華民國統計年鑑93 年版http://www.gov.tw/EBOOKS/TWANNUAL/show_book.php/path=3_008_020
6.左祖儀,以資料探勘方法研究醫師審查制度,民國92年陽明大學醫務管理研究所碩士論文,2003年。
7.呂奇傑,演化是類神經網路分類式技術,輔仁大學,應用統計研究所碩士論文, 2001年。
8.林宏達,論述血糖控制與糖尿病合併症,中華民國內分泌暨糖尿病學會會訊,第12卷,1999年5月,頁1-4。
9.沈富雄,2000,「全民健康保險的缺失與改革」,行政院衛生署位升報導雜誌社。http://www.doh.gov.tw/new/moth/page2.html
10.何維德,糖尿病病人醫療利用分析,中國醫藥學院碩士論文,2001年。
11.阮士恩,台灣人口年齡組成對醫療費用結構之影響推估,國立中正大學社會福利研究所碩士論文,2000年。
12.李玉春,”健康保險支付制度”,健康保險,楊志良主編,第三版,巨流圖書公司,1998年,頁71-117。
13.李玉春,健保公民會議正式會議,杜絕醫療浪費提升醫療品質,國立陽明大學衛生福利研究所,2005年。
14.林俊吉,我國勞保醫療費用支出增加原因之研究,1983年。
15.林文元、劉文俊,林文元,劉文俊,"妊娠糖尿病",基礎醫學,第15卷第7期,2000年7月,頁149-153
16.許志成、季瑋珠,”門診高度使用者之特性:以大溪鎮群醫中心門診病人為例”,中華衛誌,第15卷第1期,1997,頁91-96。
17.莊逸洲、李玉春,「200億藥價給付黑洞如何補救」,全民健康保險雙月刊第14期,1998年。
18.陳宗獻,2000「檢視醫療浪費」,行政院衛生署衛生報導雜誌社,http://www.doh.gov.tw/new/moth/page26.html
19.陳國團,2000「實話說健保「非不能、實不敢為也」」,行政院衛生署報導雜誌社,http://www.doh.gov.tw/new/moth/page30.html
20.陳建宇,台灣十大死因與防治,台北:聯經出版,1999年。
21.陳團景,「 健保費用審查費用之標準化與制度化」全民健保醫療服務機構服務專業審查研討會會議紀錄,1997年。
22.陳慎健,反應變數據二項分布之羅吉斯複回歸模型之研究,東海大學統計研究所碩士論文, 1998年。
23.陳建仁,「健保資料庫學術應用」,㆗央健康保險局,健保資料庫學術研討發表會,1998年
24.陳肇榮,運用財務比率預測企業財務危機之實證研究,政治大學企業管理研究所碩士論文,1983年。
25.陳蘊如,財務危機預警制度之研究,政治大學會計所碩士論文,1990年。
26.葉金川等,「調整費率才能解決財務虧空」,全民健康保險雙月刊第18期,1999年。
27.葉怡成,類神經網路模式應用與實作,儒林,2003年。
28.廖繼鋐,我國中老年醫療使用及對全民健保醫療費用影響之探討,國立中正大學社會福利研究所碩士論文,1998年。
29.趙金方,我國全民健康保險制度醫療費用影響因素之研究,1993年。
30.蔡偉德,風險校正-論人計酬的支付制度,全民健康保險醫療費用協定委員會八十七年度委託研究計劃,1998年。
31.謝邦昌、蘇志雄、鄭宇庭、葉劭緯,「資料採礦與商業智慧,鼎茂圖書出版股份有限公司」,2006年
32.謝昌勳、洪乙仁,糖尿病最新診斷標準與分類,國防醫學,30卷,2000年6月,468-473頁。
33.藍中賢,「結合模糊集合理論與貝式分類法之資料探勘技術-應用於健保醫療審查作業」,元智大學,2000年。
34.藍守仁,全民健康保險高屏地區高使用頻率保險對象就醫動機及行為之探討,中央健康保險局八十五年度委託研究計劃報告,1997年。
35.蘇木春、張孝德,機器學習:類神經網路、模糊系統以及基因演算法則,1996 年。
電子全文 電子全文(本篇電子全文限研究生所屬學校校內系統及IP範圍內開放)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top