(100.26.179.251) 您好!臺灣時間:2021/04/15 17:27
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:廖韋雅
研究生(外文):Wei-Ya Liao
論文名稱:集群方法與集群指標關係之研究
論文名稱(外文):A Study on the Relationship between Clustering Algorithms and Clustering Validity Indices
指導教授:薛友仁薛友仁引用關係
指導教授(外文):Yeou-Ren Shiue
學位類別:碩士
校院名稱:華梵大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
中文關鍵詞:集群分析凝聚式分層法-華德法模糊C平均模糊自適應網路集群評估指標
外文關鍵詞:Clustering AnalysisWard’s MethodFuzzy c-meansFuzzy Adaptive Resonance TheoryClustering Validity Index
相關次數:
  • 被引用被引用:8
  • 點閱點閱:480
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:137
  • 收藏至我的研究室書目清單書目收藏:0
集群分析一直是資料探勘中非常重要的一個方法。當所要考慮分析的資料量太過龐大時,或是目標不夠明確時,可以將所要進行的資料分群,把性質相近的資料歸成一類,讓同一群裡的資料同質性高,不同群的資料同質性低。但是對於分群的結果並沒有一定的指標可以說明何者最佳,是集群分析最大的問題。
本研究將四種較為常用的集群方法來進行分析:凝聚式分層法-華德法、模糊C平均、模糊自適應網路以及自組織映射網路結合K-Means之兩階段法,並利用Davies Bouldin Index、Root-Mean-Square Standard Deviation(RMSSTD)以及R-Square三種集群評估指標來進行分群結果評估後並將其結果進行整理,以供欲進行集群分析之人員參考。經由研究結果得到以下結論:(1)在相同的集群方法下,也會因為評估指標選擇的不同,而有不同的分群結果。(2)不同的集群方法,使用相同的評估指標進行計算,其最佳分群數相近。
Clustering Analysis is an important method in data mining. When the amount of data we need to analysis is too large, or the target attributes are not so clearly, we can cluster the similar data to the same group, to let the data in the same group has high similarity, but between those groups has low similarity. Nevertheless, the biggest problem is that there has no certain clustering validity indicator to explain which result of clustering analysis is the best.
We analysis by four common methods in this research: Ward’s method, Fuzzy C-Means, Fuzzy Adaptive Resonance Theory and the Self-Organizing Map K-Means two-stage method. And we use three clustering validity indicator to assess the results: Davies Bouldin Index, Root-Mean-Square Standard Deviation (RMSSED) and R-square. The following conclusions: (1) in the same clustering method under, we can get different result because choosing different clustering validity indicator, (2) when we calculate by the same clustering validity indicator but different clustering method, we find out that the best amounts of clustering are similar.
目 錄

誌 謝 I
摘 要 II
ABSTRACT III
目 錄 IV
表 錄 VI
圖 錄 VII
一、緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
1.3 研究範圍與限制 3
1.4 研究流程 4
二、文獻探討 5
2.1 集群方法 5
2.1.1 分層式與非分層式 6
2.1.2 模糊C平均 8
2.1.3 模糊自適應共振網路 11
2.1.4 兩階段法(SOM+K-Means) 16
2.2 集群指標 21
2.2.1 Davies Boulidin Index 22
2.2.2 Sharma四種常用統計量 23
三、研究方法 26
3.1 實驗資料集 27
3.2 資料與集群方法關係 29
3.3 集群方法與指標關係 30
四、實驗結果 33
4.1 集群方法參數設定 33
4.1.1 凝聚式分層法-華德法參數設定 33
4.1.2 Fuzzy C-Means參數設定 34
4.1.3 Fuzzy ART參數設定 34
4.1.4 SOM+K-Means參數設定 35
4.2 實驗結果分析 36
4.2.1 各方法最佳分群數 36
4.2.2 錯誤率計算 39
五、結論 41
5.1 結論 41
5.2 建議 42
參考文獻 43
[1] 葉怡成,類神經網路模式應用與實作,儒林圖書公司,台北市,民國83年。
[2] 林昇甫 洪成安,類神經網路入門與圖樣辨識,全華科技書股份有限公司,民國85年。
[3] 丁一賢,陳牧言,資料探勘,滄海書局,民國94年。
[4] 陳宇順,多變量分析,華泰書局,民國87年。
[5] 呂金河,多變量分析,滄海書局,民國94年
[6] 謝依真,「不同分群方法與不同資料來源之比較」,國立成功大學工業管理研究所碩士論文,民國90年。
[7] 張墩程,「模糊聚類演算法應用於高雄海域污染範圍之判定」,國立中山大學海洋環境及工程研究所碩士論文,民國91年。
[8] 彭雅芬,「以群聚及啟發式方法求解時窗限制下車輛巡迴路線問題」,朝陽科技大學資訊管理系碩士論文,民國93年。
[9] 陳胤斈,「一個個人化數位學習課程推薦機制之研究」,華梵大學資訊管理研究所碩士論文,民國94年。。
[10] 林意芳,「以集群法偵測迴歸分析之影響值」,國立成功大學統計研究所碩士論文,民國89年。
[11] 王錦楨,「以模糊類神經網路建立液化潛能評估模式」,國立海洋大學河海工程研究所碩士論文,民國95年。
[12] 邱志洲、田政祺、周宇超,「資料探勘中集群模式與分類模式之建構-模糊自適應共振理論網路、分類迴歸樹與類神經網路之整合與應用」,Journal of the Chinese Institute of Industrial Engineers, Vol.22, No.2, pp. 171-181, 2005.
[13] Bezdek, J.C., ”Fuzzy Mathematics in pattern classification,” Ph. D. Dissertation, Cornell University, Ithaca, N.Y., 1973.
[14] Jiwei, H., Micheline, K., Data Mining:Concepts and Techniques, Morgan Kaufmann Publish, New York., 2001.
[15] Davies D.L., Bouldin D.W., “A cluster separation measure,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.1, pp. 224-227, 1979.
[16] Sharma, S. C., Applied Multivariate Techniques, John Wiley & Sons, 1996.
[17] Grossberg, S., “Adaptive pattern classification and universal recoding :I. Parallel development and coding of neural feature detectors,” Biological Cybernetic, Vol.23, pp. 121-134, 1976.
[18] Carpenter, G. A., Grossberg, S. and Rosen, D. B., “Fuzzy ART : Fast Stable Learning and Categorization of Analog Pattern by Adaptive Resonance System,” Neural Networks, Vol.4, pp. 759-771, 1991.
[19] Xu, Rui, “Survey of Clustering Algorithms ”,IEEE Transactions on neural networks, Vol.16, No.3, May 2005.
[20] Halkidi, M., Batistakis, Y. and Vazrigiannis, M., “Clustering algorithms and validity measures” IEEE, 2001.
[21] Vesanto, J., Alhoniemi, E., “clustering of the Self-Organizing Map” ,IEEE Transactions on Neural Networks, Vol.11, No.3, May 2000.
[22] Nikhil, R. Pal, Tames C. Bezdex, “On Cluster Validity for the Fuzzy C-Means Model” ,IEEE 1995.
[23] Kuo, R.J., Ho, L. M. and Hu, C. M., “Integration of self-organizing feature map and k-means algorithm for market segmentation, ”Computers & Operation Research , 1475-1493,2002.
[24] Jain, A. K., Murty, M. N. and Flynn, P. J., “Data Clustering: A Review,” ACM Computing Surveys , Vol.31, No.3, September 1999.
[25] Punj, G., Stward, DW., “Cluster analysis in marketing research: review and suggestions for applications.” ,Journal of Marketing Research , 20:134-4 , 1983.
[26] Michael, J. A., Gordon, L., Data Mining Techniques for Marketing Sales and Customer Support , John Wiley & Son Inc.
[27] Bezdek, J. C., “Some New Index of Cluster Validity,” IEEE Transaction on Systems ,Man And Cybernetics -Part B: Cybernetics, Vol.28, No3., pp. 301-315, 1998.
[28] UCI Machine Learning Repository;http://mlearn.ics.uci.edu/MLRepository.html
[29] Cormack, R.M., “A Review of Classification,” Journal of the Royal Statistical Society, Series A , Vol.134, pp. 321-367, 1971.
[30] Dubes, R., A.K. Jain, “Validity Studies in Clustering Methodologies,” Pattern Recognition, Vol.11, pp. 235-245, 1979.
[31] Mangiameli, P., S.K. Chen, D. West, “A comparison of SOM neural network and hierarchical clustering method,” European Journal of Operational Research, Vol.93, pp. 402-417, 1996.
[32] Kohonen T. A “A simple paradigm for the self-organized formation of structured feature maps,” Competition and cooperation in neural nets. Lecture Notes in Biomathematics. Berlin: Springer, 1982.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔