跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.169) 您好!臺灣時間:2025/02/18 02:03
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳振發
研究生(外文):Jhen-Fa Chen
論文名稱:名目資料表示法對分類結果影響之分析-以高血壓疾病為例
論文名稱(外文):The Analysis of Classification Results by Different Nominal Data Representations - A Case Study of Hypertension Disease
指導教授:白炳豐白炳豐引用關係
指導教授(外文):Ping-Feng Pai
學位類別:碩士
校院名稱:國立暨南國際大學
系所名稱:資訊管理學系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:41
中文關鍵詞:支援向量機倒傳遞網路決策樹判別分析邏輯斯迴歸
外文關鍵詞:support vector machineback-propagation networkdecision treediscriminant analysislogistic regression
相關次數:
  • 被引用被引用:0
  • 點閱點閱:265
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
資料探勘與機器學習的技術廣泛地運用在很多不同的領域,各式各樣不同的資料分為數值資料、名目資料等等,許多研究中會使用名目資料來做分類及分析,並沒有探討當原始資料為名目資料時,其資料大小是否會對於分類結果產生影響,因此,本研究採取許多分類方法的應用,支援向量機(Support Vector Machine, SVM)、倒傳遞網路(Back-Propagation Network, BPN)、決策樹(Decision Tree, DT)為近年來廣泛使用且不錯的技術,及判別分析(Discriminant Analysis, DA)與邏輯斯迴歸(Logistic Regression, LR),資料來源自中央研究院研究專題調查中心的學術調查研究資料庫(SRDA),此資料庫中有許多分類,本資料屬於醫藥衛生學門的台灣地區成年和老年民眾有關慢性病的認知與預防行為研究,本研究希望透過更改名目資料的方式,瞭解名目資料的大小是否影響其分類方法的準確率,為了探討資料改變對於五種分類方法的變化,先將資料分為四個模式,將資料以等比例縮小十分之一作為模式一,原始資料作為模式二,資料以等比放大十倍作為模式三,模式四則隨機挑選函數組合來變化數值進行放大的效果,探討名目資料表示法對分類結果影響之分析。實驗結果顯示在各種技術的應用上,支援向量機的分類結果在各個模式下,擁有最佳的準確率,會擁有較佳的準確率。
Medical and hygienic data analysis is vital to our health and environment. Data mining techniques is widely used in analyzing everyday problems. Although, many researches use nominal data, the effects from data sizes have not been widely investigated. In this paper, we use support vector machine (SVM), back-propagation network (BPN), decision tree (DT), discriminant analysis (DA), logistic regression (LR) and four different models of data resizing process to examine the influences of classification accuracy from nominal data sizes. The medical and hygienic data are retrieved from survey research data archive (SRDA) from Academia Sinica of Taiwan, which are mostly researches on how well adults and elders acquire the knowledge and prevention of chronic diseases. Experiments show SVM outperformed in all four models and models that are resized smaller have an averagely higher accuracy.
致謝 I
摘要 II
Abstract III
目錄 IV
圖目錄 VII
表目錄 VIII
第壹章 緒論 - 1 -
1.1 研究背景與動機 - 1 -
1.2 研究目的 - 1 -
1.3 論文架構 - 2 -
第貳章 文獻探討 - 4 -
2.1 名目資料相關文獻之探討 - 4 -
2.2 高血壓相關文獻之探討 - 6 -
第參章 研究方法 - 8 -
3.1 研究架構圖 - 8 -
3.2 判別分析 - 9 -
3.3 邏輯斯迴歸 - 11 -
3.4 倒傳遞網路 - 12 -
3.5 支援向量機 - 14 -
3.5.1 最佳超平面 - 14 -
3.5.2 線性可分 - 15 -
3.5.3 線性不可分 - 16 -
3.6 決策樹 - 17 -
3.6.1 ID3和C4.5和C5.0演算法 - 18 -
3.6.2 CART演算法 - 20 -
3.6.3 CHAID演算法 - 21 -
第肆章 實驗結果與分析 - 22 -
4.1 資料 - 22 -
4.2 實驗結果 - 24 -
4.3 分析 - 25 -
4.3.1 判別分析 - 25 -
4.3.2 邏輯斯迴歸 - 27 -
4.3.3 倒傳遞網路 - 32 -
4.3.4 支援向量機 - 32 -
4.3.5 決策樹 - 34 -
第伍章 結論與建議 - 39 -
5.1 結論 - 39 -
5.2 未來研究方向 - 39 -
參考文獻 - 40 -
[1] 林師模、陳苑欽 (2003)。多變量分析,台北市:雙葉。
[2] 陳順宇 (2004)。多變量分析(三版),台北市:華泰。
[3] 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯 (2005)。資料探勘 Data mining,台北市:旗標。
[4] 李博智,「資料探勘在慢性病預測模式之建構」,2002,元智大學碩士論文。
[5] Cardoso, M., I. H. Themido, et al. (1999). "Evaluating a clustering solution: An application in the tourism market." Intelligent Data Analysis , 3(6): 491-510.
[6] Chae, Y. M., S. H. Ho, et al. (2001). "Data mining approach to policy analysis in a health insurance domain." International journal of medical informatics , 62(2-3): 103-111.
[7] Choi-Kwon, S. and J. S. Kim (1998). "Lifestyle factors and risk of stroke in Seoul, South Korea." Journal of Stroke and Cerebrovascular Diseases, 7(6): 414-420.
[8] Foucan, L., J. Hanley, et al. (2002). "Body mass index (BMI) and waist circumference (WC) as screening tools for cardiovascular risk factors in Guadeloupean women." Journal of clinical epidemiology , 55(10): 990-996.
[9] Groenewald, P. C. N., Mokgatlhe, L. (2005). "Bayesian computation for logistic regression." Computational Statistics and Data Analysis , 48(4): 857-868.
[10] Hunter, A., L. Kennedy, et al. (2000). "Application of neural networks and sensitivity analysis to improved prediction of trauma survival." Computer methods and programs in biomedicine , 62(1): 11-19.
[11] Leoncini, G., G. Sacchi, et al. (2002). "Microalbuminuria identifies overall cardiovascular risk in essential hypertension: an artificial neural network-based approach." Journal of hypertension , 20(7): 1315-1321.
[12] Moshkovich, H. M., A. I. Mechitov, et al. (2002). "Rule induction in data mining: effect of ordinal scales." Expert Systems with Applications, 22(4): 303-311.
[13] Muxfeldt, E. S., K. V. Bloch, et al. (2005). "True resistant hypertension: is it possible to be recognized in the office?" American Journal of Hypertension , 18(12): 1534-1540.
[14] Paternoster, D. M., A. Stella, et al. (1999). "Predictive markers of pre-eclampsia in hypertensive disorders of pregnancy." International Journal of Gynecology and Obstetrics, 66(3): 237-243.
[15] Polak, S. and A. Mendyk (2008). "Artificial neural networks based Internet hypertension prediction tool development and validation." Applied Soft Computing Journal , 8(1): 734-739.
[16] Rakotomamonjy, A., R. Le Riche, et al. (2008). "A comparison of statistical learning approaches for engine torque estimation." Control Engineering Practice, 16(1): 43-55.
[17] Rubin, P. A. (1999). "Adapting the Warmack–Gonzalez algorithm to handle discrete data." European Journal of Operational Research, 113(3): 632-642.
[18] Saito, K. and R. Nakano (2002). "Extracting regression rules from neural networks." Neural Networks , 15(10): 1279-1288.
[19] Su, C. T. and C. H. Yang (2008). "Feature selection for the SVM: An application to hypertension diagnosis." Expert Systems with Applications, 34(1): 754-763.
[20] Ture, M., I. Kurt, et al. (2005). "Comparing classification techniques for predicting essential hypertension." Expert Systems with Applications, 29(3): 583-588.
[21] Zhang, J., A. J. Morris, et al. (1999). "Estimation of impurity and fouling in batch polymerisation reactors through the application of neural networks." Computers and Chemical Engineering, 23(3): 299-312.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊