跳到主要內容

臺灣博碩士論文加值系統

(3.236.84.188) 您好!臺灣時間:2021/08/03 17:12
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:李進鴻
研究生(外文):Chin-hung Li
論文名稱:基於屬性值分割與蟻群分群技術之遺漏資料處理
論文名稱(外文):Missing data processing based on attribute values partitioning and ant colony clustering
指導教授:邱宏彬邱宏彬引用關係
指導教授(外文):Hung-pin Chiu
學位類別:碩士
校院名稱:南華大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:72
中文關鍵詞:蟻群演算法遺漏值群集分析屬性值分割
外文關鍵詞:ant colony optimization algorithmclustering analysismissing value estimationdata miningattribute values partitioning
相關次數:
  • 被引用被引用:3
  • 點閱點閱:329
  • 評分評分:
  • 下載下載:54
  • 收藏至我的研究室書目清單書目收藏:0
  資料探勘的過程中,資料的遺漏或缺失可能會使得探勘的結果產生異常與偏誤,導致組織決策判斷錯誤,進而造成企業經營績效的損失。因此該如何精準地估計並填補這些遺漏資訊,正是資料探勘的前置處理作業中相當重要的課題之一。本研究基於屬性值分割方法以及蟻群分群演算法,發展出一套完整的遺漏值推估模組,藉以估計資料屬性中的遺漏資訊。我們利用蟻群分群方法為基礎並且加以改良,提出改良式蟻群分群演算方法,並且將其應用於遺漏值推估問題上。
 
  利用分群演算法所發展的遺漏值推估方法,主要是以物以類聚的資料特性,藉由資料分群取得群集相關資訊,用以作為遺漏值估計回填的依據。而從我們的實驗結果顯示,改良式蟻群分群方法確實有助於提昇解決分群問題的效率,此外在遺漏值推估部份,不論是屬性值分割或是蟻群分群方法之遺漏值推估模式,遺漏值的估計回填效果都要較傳統利用屬性平均值回填來的準確。
  Data mining is an important technique to extract useful knowledge from a set of raw data. The managers can exploit the mining knowledge to make right decisions. However, missing data significantly distort data mining results. Therefore, data preprocessing of missing values becomes extremely critical in successful data mining. Data clustering techniques is the partitioning of a dataset into clusters so that the data records in each cluster possess common characteristics. The shared characteristics can be utilized to predict the missing values. In this study, we propose an attribute values partitioning technique to preserve the relationships between attributes for estimating missing values. On the other hand, ant colony optimization (ACO) algorithm was recently proposed by few researchers to solve data clustering problems. In this study, we propose an improved ACO clustering approach, and employ the ant clustering as a basis to estimate the missing data. Furthermore, we integrate the attribute values partitioning with the ant clustering techniques to improve the estimation performance. Effectiveness of the proposed approaches is demonstrated on four datasets for four different rates of missing data. The empirical evaluation shows the improved ant clustering algorithm outperforms the previous methods in clustering quality, and the integrated missing data processing approach provides competitive results or performs well compared with the existing methods.
第一章 緒論 1
第一節、研究背景 1
第二節、研究動機與目的 2
第三節、研究流程 4
第四節、論文架構 4
 
第二章 文獻探討 6
第一節、遺漏值處理 6
第二節、群集分析問題 9
第三節、蟻群最佳化演算法 13
 
第三章 改良式蟻群分群演算法 22
第一節、改良式蟻群分群演算方法 22
第二節、改良式蟻群分群演算法演算流程 25
 
第四章 遺漏值推估方法 34
第一節、基礎遺漏值推估模組 34
第二節、基於屬性值分割方法之遺漏值推估模組 37
第三節、基於蟻群分群方法之遺漏值推估模組 45
第四節、基於屬性值分割與蟻群分群方法之遺漏值推估模組 51
 
第五章 實驗設計與結果分析 53
第一節、實驗環境 53
第二節、實驗參數設定 53
第三節、實驗資料描述 54
第四節、實驗設計 58
第五節、實驗結果分析 59
 
第六章 結論與未來展望 70
第一節、結論 70
第二節、未來展望 71
 
參考文獻 72
[1] J. MacQUEEN, “SOME METHODS FOR CLASSIFICATION AND ANALYSIS OF MULTIVARIATE OBSERVATIONS”, 1967.
 
[2] M. Dorigo, G. Di Caro. “Ant colony optimization: a new meta-heuristic,” IEEE Transactions on Evolutionary Computation, 1999.
 
[3] M. Dorigo, and L. M. Gambardella. “Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem,” IEEE Transactions on Evolutio- nary Computation, 1(1), 1997, pp. 53–66.
 
[4] M. Dorigo, M. Birattari, and T. Stutzle. “Ant Colony Optimization: Artificial Ants as a Computational Intelligence Technique,” IEEE Computional Intellige- nce Magazine, November 2006, pp. 28-39.
 
[5] M. Dorigo, V. Maniezzo, and A. Colorni. “The ant system: optimization by a colony of cooperating agents,” IEEE Transactions on Systems, Man, and Cybernetics–Part B, vol. 26, No. 2, 1996, pp. 29–41.
 
[6] P. S. Shelokar, V. K. Jayaraman, and B. D. Kulkarni. “An ant colony approach for clustering,” Analytica Chimica Acta (509), 2004, pp. 187-195.
 
[7] 李泰琳、張靖及卓裕仁,「調適型螞蟻演算法應用於旅行推銷員問題之研究」,運輸學刊,第十九卷第一期,民國96年3月,頁89-120。
 
[8] 沈永勝,「整合自動分群與加權式灰關聯技術於大型資料庫內遺失值之處理」,台灣科技大學電子工程學系碩士論文,民國94年6月。
 
[9] 林俊男,「應用類神經網路法於遺漏值問題之研究」,南華大學資訊管理學系碩士論文,民國94年6月。
 
[10] 游裕昌,「運用基因群集技術於大型資料庫內遺失值之處理」,台灣科技大學電子工程學系碩士論文,民國93年6月。
 
[11] 曾憲雄、蔡秀滿、蘇東興、曾秋蓉及王慶堯,「資料探勘」,旗標出版股份有限公司,台北,民國96年3月。
 
[12] 魏岑甄,「基於反彈機KPSO分群之有效遺漏推估方法」,南華大學資訊管理學系碩士論文,民國97年6月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top