跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.81) 您好!臺灣時間:2025/02/13 07:00
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳榮男
研究生(外文):Jung-Nan Chen
論文名稱:應用部分最小平方法於健檢項目間關聯性之探討
論文名稱(外文):Using the Partial Least Squares to Explore the Correlation among the Items of the Physical Examination
指導教授:古東源古東源引用關係
指導教授(外文):Tong-Yuan Koo
學位類別:碩士
校院名稱:國立雲林科技大學
系所名稱:工業工程與管理研究所碩士班
學門:工程學門
學類:工業工程學類
論文種類:學術論文
論文出版年:2008
畢業學年度:96
語文別:中文
論文頁數:69
中文關鍵詞:部分最小平方法決策樹基因演算法
外文關鍵詞:Partial Least SquaresDecision TreeGenetic Algorithm
相關次數:
  • 被引用被引用:1
  • 點閱點閱:241
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
通常各行業皆希望從手中所收集到資料,去找出具有相關且有效的資訊或規則,作為處理事務上的參考依據。針對不同資料庫類型與資料屬性,有著各種不同的分析工具,而其中以資料探勘與人工智慧技術的應用較為廣泛。郭金忠曾以人工智慧技術中的基因演算法結合資料探勘技術中的決策樹為方法,針對醫療業的成人健檢資料為例,探討檢測項目之間的關聯性,唯其技術上的整合與分析過程太過繁雜。而統計資料分析中的部分最小平方法(PLS),亦是探討檢測項目之間的潛在關係的良好工具。
本研究嘗試以麩草醋酸轉胺酶(GOT)、血清尿素氮(BUN)、血清球蛋白(Glo)這三項檢測項目作為分析的目標。透過PLS分析後所得到的結果,與郭金忠所得到的結果進行對照,透過解釋能力比與選取的項目比對的結果發現,PLS不僅能掌握住重要的項目,而且在資料處理與分析過程相當簡易。並且在分析關聯性較高的資料時,使用小樣本,PLS的選擇也可以有不錯的表現。
Guo used genetic algorithm and decision tree analysis to extract information about the relationship between biological variables from physical examination data and shown that the combination of genetic algorithm and decision tree is useful in this job. But the combination of genetic algorithm and decision tree is not easy work. This study adopts the partial least squares method which is easy to use to evolve useful subset of discriminatory features for physical examination data. Three variables: Aspartate aminotransferase (GOT), Blood urea nitrogen (BUN), Globulin (Glo) are used to compare the results to Guo’s research.
The result shows that the partial least squares method performs as well as the combination of genetic algorithm and decision tree in extracting information about the relationship between biological variables from physical examination data. And has the advantage of simple and easy to use. The result also shows that the partial least squares method can generate good results even with small sample size.
目錄
中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
表目錄 VI
圖目錄 VIII
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
第二章 文獻探討 3
2.1 決策樹與基因演算法的運用與整合 3
2.2 部分最小平方法(PARTIAL LEAST SQUARES,PLS) 4
2.2.1 最小平方法(Least Squares) 4
2.2.2 主成份分析(Principal Component Analysis,PCA) 5
2.2.3 部分最小平方法(Partial Least Squares,PLS) 6
2.3 PLS的應用 9
第三章 研究資料及方法 11
3.1 健檢資料 11
3.2 欲分析的目標項目 14
3.3 PLS分析示意圖 15
3.4 PLS分析(N=5431) 16
3.4.1 資料輸入項目 16
3.4.2 選擇潛在變數個數 16
3.4.3 PLS重要變數的選擇 18
3.4.4 驗證重要變數的解釋能力 19
3.4.5 PLS模式 20
3.5 PLS分析(N=25) 21
3.5.1 資料輸入項目 21
3.5.2 統整50次PLS分析的結果 22
3.5.3 重要變數的篩選 22
3.5.4 驗證重要變數的解釋能力 23
3.6 逐步迴歸分析 23
第四章 結果分析 25
4.1 PLS分析 (樣本數為5431) 26
4.1.1 PLS目標項目:麩草醋酸轉胺酶(GOT) 26
4.1.2 PLS目標項目:血清尿素氮(BUN) 29
4.1.3 PLS目標項目:血清球蛋白(Glo) 32
4.2 PLS分析 (樣本數為25) 35
4.2.1 PLS目標項目:麩草醋酸轉胺酶(GOT) 35
4.2.2 PLS目標項目:血清尿素氮(BUN) 36
4.2.3 PLS目標項目:血清球蛋白(Glo) 37
4.3 逐步迴歸分析 38
4.3.1 迴歸分析目標項目:麩草醋酸轉胺酶(GOT) 38
4.3.2 迴歸分析目標項目:血清尿素氮(BUN) 40
4.3.3 迴歸分析目標項目:血清球蛋白(Glo) 41
4.4 結果比較 41
4.4.1 麩草醋酸轉胺酶(GOT) 41
4.4.2 血清尿素氮(BUN) 44
4.4.3 血清球蛋白(Glo) 46
4.4.4 小結 47
4.5 樣本數為25與50之結果比較 49
4.5.1 麩草醋酸轉胺酶(GOT) 49
4.5.2 血清尿素氮(BUN) 51
第五章 結論 54
參考文獻 56

表目錄
表3-1 健檢資料摘要 11
表3-2 資料類型與正常值範圍 14
表3-3 GOT自變項與應變項項目 16
表3-4 GOT的ROOT MEAN PRESS表(N=5431) 17
表3-5 GOT潛在變數解釋百分比表(N=5431) 18
表3-6 GOT的VIP值(N=5431) 19
表3-7 GOT重要變數的解釋百分比表(N=5431) 20
表3-8 GOT之 係數值表(N=5431) 21
表3-9 50次中15次有結果的重要自變項彙整表(N=25) 22
表3-10 GOT迴歸分析摘要表(N=25) 23
表3-11 GOT實際選取組合表 24
表3-12 GOT的逐步迴歸摘要表 24
表4-1 GOT的ROOT MEAN PRESS表 (N=5431) 26
表4-2 GOT 的VIP表 (N=5431) 27
表4-3 GOT重要變數的解釋百分比表 (N=5431) 27
表4-4 GOT的逐步迴歸摘要表 (N=5431) 28
表4-5 BUN的ROOT MEAN PRESS表 (N=5431) 29
表4-6 BUN的VIP表 (N=5431) 30
表4-7 BUN重要變數的解釋百分比表 (N=5431) 30
表4-8 BUN的逐步迴歸摘要表 (N=5431) 31
表4-9 GLO的ROOT MEAN PRESS表 (N=5431) 32
表4-10 GLO的VIP表 (N=5431) 33
表4-11 GLO重要變數的解釋百分比表 (N=5431) 33
表4-12 GLO的逐步迴歸摘要表 (N=5431) 34
表4-13 50次GOT之PLS分析中15次有結果的重要自變項彙整表 (N=25) 35
表4-14 GOT迴歸分析摘要表 (N=25) 36
表4-15 50次BUN之PLS分析中11次有結果的重要自變項彙整表 (N=25) 36
表4-16 BUN迴歸分析摘要表 (N=25) 37
表4-17 50次GLO之PLS分析中34次有結果的重要自變項彙整表 (N=25) 37
表4-18 GLO迴歸分析摘要表 (N=25) 38
表4-19 GOT實際選取組合表 39
表4-20 GOT的逐步迴歸摘要表 39
表4-21 BUN實際選取組合表 40
表4-22 BUN的逐步迴歸摘要表 40
表4-23 GLO實際選取組合表 41
表4-24 GLO的逐步迴歸摘要表 41
表4-25 GOT SPSS分析結果比較表 42
表4-26 GOT實際選取項目對照表(N=5431) 42
表4-27 GOT實際選取項目對照表(N=25) 43
表4-28 GOT SPSS分析結果比較表(相同的項目) 43
表4-29 BUN SPSS分析結果比較表 44
表4-30 BUN實際選取項目對照表(N=5431) 44
表4-31 BUN實際選取項目對照表(N=25) 45
表4-32 BUN SPSS分析結果比較表(相同的項目) 45
表4-33 GLO SPSS分析結果比較表 46
表4-34 GLO實際選取項目對照表(N=5431) 46
表4-35 GLO實際選取項目對照表(N=25) 47
表4-36 GLO SPSS分析結果比較表(相同的項目) 47
表4-37 50次中29次有結果的重要自變項統整表 (N=50) 49
表4-38 GOT迴歸分析摘要表 (N=50) 49
表4-39 GOT 樣本數為25與50的結果比較表 50
表4-40 GOT實際選取項目對照表(N=25&N=50) 50
表4-41 GOT實際選取項目對照表(N=50) 51
表4-42 50次中17次有結果的重要自變項統整表 (N=50) 51
表4-43 BUN迴歸分析摘要表 (N=50) 52
表4-44 BUN 樣本數為25與50的結果比較表 52
表4-45 BUN實際選取項目對照表(N=25&N=50) 52
表4-46 BUN實際選取項目對照表(N=50) 53


圖目錄
圖3-1 PLS分析示意圖 15
[1]郭金忠,2006,“建立資料分類模式用以探討因子間群聚關係”,雲林科技大學工業工程與管理研究所,碩士論文。
[2]陳美球、劉序、陳文波、黃靚、肖志豪,2006,“鄱陽湖地區1985-2000年土地利用格局變化及其社會經濟驅動力研究 II. 土地利用格局變化驅動力分析”,安徽農業大學學報 33(1) 123-129。
[3]陳順宇,2004,“多變量分析”,台北市,華泰書局。
[4]許和達、賴明勇、錢曉英,2002,“外商直接投資影響因素的偏最小二乘回歸建模分析”,Chinese Journal of Management Science Vol. 10 No. 5 20-25。
[5]Fonarow, G. C., Adams, K. F., Abraham, W. T., Yancy, C. W., and Boscardin, J. W., 2005, “Risk Stratification for In-Hospital Mortality in Acutely Decompensated Heart Failure Classification and Regression Tree Analysis” Journal of the American Medical Association, Vol 293, No. 5, pp.572-580.
[6]Hardy, A. J., MacLaurin, P., Haswell, S. J., Jong, S. de, Vandeginste, B. G.M., 1996, “Double-case Diagnostic for Outliers Identification”, Chemometrics and Intelligent Laboratory Systems 34 117-129.
[7] Johnson, R. A., Wichern, D. W., 2002, Applied Multivariate Statistical Analysis –Fifth Edition-, Pearson Education International.
[8]Nestor, P. G., O’Donnell, B. F., McCarley, R. W., Niznikiewicz, M., Barnard, J., Shen, Z. J., Bookstein, F. L., Shenton, M. E., 2002,“A New Statistical Method for Testing Hypotheses of Neuropsychological/MRI Relationships in Schizophrenia: Partial Least Squares Analysis”, Schizophrenia Research 53 57-66.
[9]Raymer, M. L., Doom, T. E., Kuhn, L. A. and Punch, W. F., 2003, “Knowledge Discovery in Medical and Biological Datasets Using a Hybrid Bayes Classifier/Evolutionary Algorithm”, IEEE Transactions on systems, man, and cybernetics—part B: cybernetics, Vol. 33, No. 5, pp.802-813.
[10]Siedlecki, W. and Sklansky, J., 1989, “A Note on Genetic Algorithms for Largescale Feature Selection”, Pattern Recognition Letters., Vol. 10, pp.335–347.
[11]Ture, M., Kurt, I., Kurum, A. I. and Ozdamar, K., 2005, “Comparing Classification Techniques for Predicting Essential Hypertension”, Expert Systems with Applications Vol.29, pp.583–588.
[12]Vafaie, H. and Jong, K. D., 1998, “Evolutionary Feature Space Transformation, in Feature Extraction”, Construction and Selection: A Data Mining Perspective, edited by Liu, H. and Motoda, H., Norwell, Kluwer, ch. 19, pp. 307–323.
[13] Wold, S. ,1994, "PLS for Multivariate Linear Modeling," QSAR: Chemometric Methods in Molecular Design. Methods and Principles in Medicinal Chemistry, ed. H. van de Waterbeemd, Weinheim, Germany: Verlag-Chemie.
[14]Wold, S., Eriksson, L., Trygg, J., Kettaneh, N., 2004,“The PLS method -- Partial Least Squares Projections to Latent Structures-- and its Applications in Industrial RDP (research, development, andproduction), Submitted version.
[15]Zhao, H., and Ram, S., 2004, “Constrained Cascade Generalization of Decision Trees”, IEEE Transactions on knowledge and data engineering, Vol. 16, No. 6, pp.727-739.
[16] http://www.statsoft.com/textbook/stpls.html
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊