研究生(外文):Jung-Nan Chen
論文名稱(外文):Using the Partial Least Squares to Explore the Correlation among the Items of the Physical Examination
指導教授(外文):Tong-Yuan Koo
外文關鍵詞:Partial Least SquaresDecision TreeGenetic Algorithm
Guo used genetic algorithm and decision tree analysis to extract information about the relationship between biological variables from physical examination data and shown that the combination of genetic algorithm and decision tree is useful in this job. But the combination of genetic algorithm and decision tree is not easy work. This study adopts the partial least squares method which is easy to use to evolve useful subset of discriminatory features for physical examination data. Three variables: Aspartate aminotransferase (GOT), Blood urea nitrogen (BUN), Globulin (Glo) are used to compare the results to Guo’s research.
The result shows that the partial least squares method performs as well as the combination of genetic algorithm and decision tree in extracting information about the relationship between biological variables from physical examination data. And has the advantage of simple and easy to use. The result also shows that the partial least squares method can generate good results even with small sample size.
中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
表目錄 VI
圖目錄 VIII
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
第二章 文獻探討 3
2.1 決策樹與基因演算法的運用與整合 3
2.2.1 最小平方法(Least Squares) 4
2.2.2 主成份分析(Principal Component Analysis,PCA) 5
2.2.3 部分最小平方法(Partial Least Squares,PLS) 6
2.3 PLS的應用 9
第三章 研究資料及方法 11
3.1 健檢資料 11
3.2 欲分析的目標項目 14
3.3 PLS分析示意圖 15
3.4 PLS分析(N=5431) 16
3.4.1 資料輸入項目 16
3.4.2 選擇潛在變數個數 16
3.4.3 PLS重要變數的選擇 18
3.4.4 驗證重要變數的解釋能力 19
3.4.5 PLS模式 20
3.5 PLS分析(N=25) 21
3.5.1 資料輸入項目 21
3.5.2 統整50次PLS分析的結果 22
3.5.3 重要變數的篩選 22
3.5.4 驗證重要變數的解釋能力 23
3.6 逐步迴歸分析 23
第四章 結果分析 25
4.1 PLS分析 (樣本數為5431) 26
4.1.1 PLS目標項目:麩草醋酸轉胺酶(GOT) 26
4.1.2 PLS目標項目:血清尿素氮(BUN) 29
4.1.3 PLS目標項目:血清球蛋白(Glo) 32
4.2 PLS分析 (樣本數為25) 35
4.2.1 PLS目標項目:麩草醋酸轉胺酶(GOT) 35
4.2.2 PLS目標項目:血清尿素氮(BUN) 36
4.2.3 PLS目標項目:血清球蛋白(Glo) 37
4.3 逐步迴歸分析 38
4.3.1 迴歸分析目標項目:麩草醋酸轉胺酶(GOT) 38
4.3.2 迴歸分析目標項目:血清尿素氮(BUN) 40
4.3.3 迴歸分析目標項目:血清球蛋白(Glo) 41
4.4 結果比較 41
4.4.1 麩草醋酸轉胺酶(GOT) 41
4.4.2 血清尿素氮(BUN) 44
4.4.3 血清球蛋白(Glo) 46
4.4.4 小結 47
4.5 樣本數為25與50之結果比較 49
4.5.1 麩草醋酸轉胺酶(GOT) 49
4.5.2 血清尿素氮(BUN) 51
第五章 結論 54
參考文獻 56

表3-1 健檢資料摘要 11
表3-2 資料類型與正常值範圍 14
表3-3 GOT自變項與應變項項目 16
表3-4 GOT的ROOT MEAN PRESS表(N=5431) 17
表3-5 GOT潛在變數解釋百分比表(N=5431) 18
表3-6 GOT的VIP值(N=5431) 19
表3-7 GOT重要變數的解釋百分比表(N=5431) 20
表3-8 GOT之 係數值表(N=5431) 21
表3-9 50次中15次有結果的重要自變項彙整表(N=25) 22
表3-10 GOT迴歸分析摘要表(N=25) 23
表3-11 GOT實際選取組合表 24
表3-12 GOT的逐步迴歸摘要表 24
表4-1 GOT的ROOT MEAN PRESS表 (N=5431) 26
表4-2 GOT 的VIP表 (N=5431) 27
表4-3 GOT重要變數的解釋百分比表 (N=5431) 27
表4-4 GOT的逐步迴歸摘要表 (N=5431) 28
表4-5 BUN的ROOT MEAN PRESS表 (N=5431) 29
表4-6 BUN的VIP表 (N=5431) 30
表4-7 BUN重要變數的解釋百分比表 (N=5431) 30
表4-8 BUN的逐步迴歸摘要表 (N=5431) 31
表4-9 GLO的ROOT MEAN PRESS表 (N=5431) 32
表4-10 GLO的VIP表 (N=5431) 33
表4-11 GLO重要變數的解釋百分比表 (N=5431) 33
表4-12 GLO的逐步迴歸摘要表 (N=5431) 34
表4-13 50次GOT之PLS分析中15次有結果的重要自變項彙整表 (N=25) 35
表4-14 GOT迴歸分析摘要表 (N=25) 36
表4-15 50次BUN之PLS分析中11次有結果的重要自變項彙整表 (N=25) 36
表4-16 BUN迴歸分析摘要表 (N=25) 37
表4-17 50次GLO之PLS分析中34次有結果的重要自變項彙整表 (N=25) 37
表4-18 GLO迴歸分析摘要表 (N=25) 38
表4-19 GOT實際選取組合表 39
表4-20 GOT的逐步迴歸摘要表 39
表4-21 BUN實際選取組合表 40
表4-22 BUN的逐步迴歸摘要表 40
表4-23 GLO實際選取組合表 41
表4-24 GLO的逐步迴歸摘要表 41
表4-25 GOT SPSS分析結果比較表 42
表4-26 GOT實際選取項目對照表(N=5431) 42
表4-27 GOT實際選取項目對照表(N=25) 43
表4-28 GOT SPSS分析結果比較表(相同的項目) 43
表4-29 BUN SPSS分析結果比較表 44
表4-30 BUN實際選取項目對照表(N=5431) 44
表4-31 BUN實際選取項目對照表(N=25) 45
表4-32 BUN SPSS分析結果比較表(相同的項目) 45
表4-33 GLO SPSS分析結果比較表 46
表4-34 GLO實際選取項目對照表(N=5431) 46
表4-35 GLO實際選取項目對照表(N=25) 47
表4-36 GLO SPSS分析結果比較表(相同的項目) 47
表4-37 50次中29次有結果的重要自變項統整表 (N=50) 49
表4-38 GOT迴歸分析摘要表 (N=50) 49
表4-39 GOT 樣本數為25與50的結果比較表 50
表4-40 GOT實際選取項目對照表(N=25&N=50) 50
表4-41 GOT實際選取項目對照表(N=50) 51
表4-42 50次中17次有結果的重要自變項統整表 (N=50) 51
表4-43 BUN迴歸分析摘要表 (N=50) 52
表4-44 BUN 樣本數為25與50的結果比較表 52
表4-45 BUN實際選取項目對照表(N=25&N=50) 52
表4-46 BUN實際選取項目對照表(N=50) 53

圖3-1 PLS分析示意圖 15
