跳到主要內容

臺灣博碩士論文加值系統

(2600:1f28:365:80b0:1fb:e713:2b67:6e79) 您好!臺灣時間:2024/12/12 15:45
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:陳佳蓉
研究生(外文):Joyze Chan
論文名稱:干擾變數對分類樹準確度的效力評估
指導教授:史玉山史玉山引用關係
指導教授(外文):Yu-Shan Shih
學位類別:碩士
校院名稱:國立中正大學
系所名稱:統計科學所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2006
畢業學年度:94
語文別:中文
論文頁數:69
中文關鍵詞:干擾變數分類樹
外文關鍵詞:noise variablestree
相關次數:
  • 被引用被引用:0
  • 點閱點閱:271
  • 評分評分:
  • 下載下載:37
  • 收藏至我的研究室書目清單書目收藏:0
本文主要探討干擾變數對分類樹準確度的影響。我們使用 CRUISE 、 LMT 、 QUEST 和 RF 四種分類樹方法,藉由不同的切割變數選取法建構出七種不同構造分類樹的演算法,
透過69筆實務資料並加上不同個數的干擾變數來了解其預測表現。平均而言,以 LMT 方法的預測表現最好, CRUISE 之 2D 的設定方法表現最差;在各種演算法受到干擾變數的影響方面,以 CRUISE 之 1D 的設定與 QUEST 以單變量為切割變數的設定方法最不容易受到干擾變數的影響,而 QUEST 之線性組合的變數為切割變數設定以及 RF 方法則最容易受到干擾變數的影響。另外,在單變量切割變數的選取方面,相對於 CRUISE 之 1D 與 2D 的設定和 QUEST 以單變量為切割變數的設定方法, LMT 方法會傾向選取切點個數較少的切割變數。
1 導論
2 演算法之介紹
2.1 CRUISE 方法
2.2 LMT 方法
2.3 QUEST 方法
2.4 RF 方法
3 實驗設計
3.1 資料集
3.2 演算法
4 實驗結果
4.1 無母數分析
4.2 實驗一
4.3 實驗二
4.4 實驗三
5 結論與建議
附錄
參考文獻
Breiman, L. (1996). Bagging predictors, Machine Learning, 24, 123-140.

Breiman, L. (2001). Random forests, Machine Learning, 45, 5-32.

Breiman, L., Friedman, J. H., Olshen, R. A. and Stone, C. J. (1984). Classification and Regression Trees, Wadsworth, Belmont, CA.

Chan, K. Y., and Loh, W. Y. (2004). LOTUS: An algorithm for building accurate and comprehensible logistic regresion trees, Journal of Computational and Graphical Statistics, 13:4, 826-852.

Conover, W. J. (1999). Practical Nonparametric Statistics, John Wiley, New York.

Friedman, J., Hastie, T., and Tibshirani, R. (2000). Additive logistic regression: A statistical view of boosting, The Annals of Statistics, 38:2, 337-374.

Kim, H. and Loh, W.-Y. (2001). Classification trees with unbiased multiway splits, Journal of the American Statistical Association, 96, 589-604.

Landwehr, N., Hall, M., and Frank, E. (2005). Logistic model trees, Machine Learning, 59, 161-205.

Lim, T.-S., Loh, W.-Y. and Shih, Y.-S. (2000). A comparison of prediction accuracy,complexity,and training time of thirty-three old and new classification algorithm, Machine Learning, 40, 203-228.

Loh, W.-Y. and Shih, Y.-S. (1997). Split selection methods for classification trees, Statistica Sinica, 7, 815-840.

Merz, C. and Murphy, P. (1996). UCI Repository of Machine Learning Databases., Department of Information and Computer Science, Univeristy of California, Irvine, CA.

Quinlan, J. R. (1993). C4.5: Programs for Machine Learning, San Mateo, Morgan Kaufmann.

Witten, I. H., and Frank, E. (2005). Data Mining: Practical Machine Learning Tools and Techniques, 2nd ed., San Francisco: Morgan Kaufmann.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關論文
 
1. 成之約,1998,〈淺論派遣勞動及其對勞資關係的影響〉,《就業與訓練》,第16卷,第6期。
2. 李碧涵,2002,〈勞動體制的發展:全球化下的挑戰與改革〉,《社會政策與社會工作學刊》,第6卷,第1期,頁185-219。
3. 李碧涵,2002,〈勞動體制的發展:全球化下的挑戰與改革〉,《社會政策與社會工作學刊》,第6卷,第1期,頁185-219。
4. 李誠,1999,〈非自願性失業與台灣的永續發展〉,《社會文化學報》,第8卷。
5. 李誠,1999,〈非自願性失業與台灣的永續發展〉,《社會文化學報》,第8卷。
6. 林忠正,1988,〈初入勞動市場階級之工資性別差異〉,《經濟論文叢刊》,第16卷,第3期。
7. 成之約,1998,〈淺論派遣勞動及其對勞資關係的影響〉,《就業與訓練》,第16卷,第6期。
8. 林忠正,1988,〈初入勞動市場階級之工資性別差異〉,《經濟論文叢刊》,第16卷,第3期。
9. 張晉芬,1993,〈企業組織中升遷機會的決定及員工的期望:兼論內部勞動市場理論的應用〉,《人文及社會科學集刊》,第6卷,第1期,頁205-230。
10. 張晉芬,1993,〈企業組織中升遷機會的決定及員工的期望:兼論內部勞動市場理論的應用〉,《人文及社會科學集刊》,第6卷,第1期,頁205-230。
11. 許嘉猷,1981,〈新結構論—社會階層研究的新方向〉,《思與言》,第19卷,第3期,頁234-249。
12. 許嘉猷,1981,〈新結構論—社會階層研究的新方向〉,《思與言》,第19卷,第3期,頁234-249。
13. 陳建甫,1986,〈影響地區相對貧窮率因素之研究:以一九八四至一九九四年臺灣縣市地區為例〉,《社區發展季刊》,第76期,頁195-213。
14. 陳建甫,1986,〈影響地區相對貧窮率因素之研究:以一九八四至一九九四年臺灣縣市地區為例〉,《社區發展季刊》,第76期,頁195-213。
15. 曾敏傑,1998,〈台灣核心與邊陲產業的分類—一九九0年代初期的靜態測量〉,《東吳社會學報》,第7期,頁361-394。