(3.235.139.152) 您好!臺灣時間:2021/05/08 18:45
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

: 
twitterline
研究生:廖俊凱
研究生(外文):Liao, Chun-Kai
論文名稱:在大型交易資料庫中利用有效率演算法探勘數量關聯規則
論文名稱(外文):Using Efficient Algorithms for Mining Quantitation Association Rules in Large Transactional Databases
指導教授:陳垂呈陳垂呈引用關係
指導教授(外文):Chen, Chui-Cheng
學位類別:碩士
校院名稱:南台科技大學
系所名稱:資訊管理系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2005
畢業學年度:93
語文別:中文
論文頁數:58
中文關鍵詞:資料探勘關聯規則數量關聯規則布林運算FP-tree
外文關鍵詞:data miningassociation rulesquantitative association rulesBoolean computationFP-tree
相關次數:
  • 被引用被引用:11
  • 點閱點閱:202
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:67
  • 收藏至我的研究室書目清單書目收藏:0
在現在資訊科技發達的今天,人類的生活已經無法缺少資訊科技的幫助,隨著時間的推移資訊科技也在快速的成長,資料儲存空間不只更加便宜,儲存量也迅速擴張。而要能從這些龐大資料庫中,希望能夠挖掘出潛在有用的資訊或知識,這個過程稱之為資料探勘(data mining)。資料探勘是指從大量資料中,可以完成下列的工作或是更多:關聯規則(association rules)、次序相關(sequence)、分群化(clustering)、分類(classification)、及預測(forecasting)等。資料探勘技術可以廣泛應用在各個領域中,其中關聯規則探勘是最常被用來做分析的技術。目前關聯規則的演算法可依需不需要產生候選項目集(candidate itemset)的作法分為兩類,以Frequent-Pattern tree與Apriroi-like approach為代表。這兩個方法最主要的差異是在,Frequent-Pattern tree並不產生候選項目集,它將資料庫壓縮在Frequent-Pattern tree結構中,可以免除太多次的資料庫掃瞄;而後者則是需要產生候選項目集。
本論文的目的是希望以FP-tree(Frequent-Pattern tree)為理論基礎,並透過布林運算方法以及商品數量概念的探勘方法,希望在大量商品資料庫中搜尋商品與數量間之關聯規則。在實作方面以修改過後的演算法作效能做比較測試,並利用布林運算加速資料探勘的效率。再者,我們應用於探勘包含有某一特定商品與數量關聯規則。
With the rapid advancing technology nowadays, humans can not afford to live without information technology. As the time goes by, with the fast growth of information technology, the data storage devices are getting more low-priced and that leads to the storage capacity of database expanded rapidly. Hence, searching for useful information in a huge database efficiently becomes crucial and the process for data searching is called data mining. Data mining can accomplish the following tasks or more in a huge database: association rules, sequence, clustering, classification, and forecasting. Data mining technology can widely apply in many fields, and association rules is one of the popular methods in data analysis. Association Rules can be categorized by productions of candidate itemset into two groups, and Frequent-Pattern tree and Apriori-like approach are most representative for each group. The main difference between the two methods is that Frequent-Pattern tree does not require producing candidate itemset during process, but instead this method compresses data into the structure of Frequent-Pattern tree, so that we can avoid redundant data searching in database. Apriroi-like approach requires producing candidate itemset during data searching.
The purpose of this thesis is to apply FP-tree(Frequent-Pattern tree)base theory through Boolean algorithm and quantity methods to accomplish data mining. By this application, the program can figure out the rule of relationship between the merchandise and their quantities in large database. In practice, the programs apply optimizing calculation method into efficiency tests, and also apply Boolean algorithm to optimize data mining efficiency. Furthermore, we applied Boolean FP-tree calculation into single merchandise data mining.
摘要 i
英文摘要 ii
致謝 iv
目次 v
表目錄 vi
圖目錄 vii
第一章 緒論 1
1.1研究背景與動機 1
1.2研究目的 2
1.3研究範圍與限制 3
1.4研究流程 5
1.5論文架構 7
第二章 相關文獻與探討 9
2.1資料探勘介紹 9
2.2 FP-tree 演算法 11
2.3布林演算法 16
第三章 修改FP-tree演算法探勘包含有項目數量之關聯規則 21
3.1探勘關聯規則 21
3.2實例說明 23
第四章 利用布林運算為基礎探勘包含有項目數量之關聯規則 29
4.1布林運算為基礎之探勘數量關聯規則 29
4.2實例說明 30
第五章 探勘與某一商品相關之數量關聯規則 36
5.1探勘包含有某一商品之數量關聯規則 36
5.2實例說明 38
第六章 系統建置與效能分析 41
6.1實驗設備及實驗說明 41
6.2以布林運算為基礎之效能評估 43
6.3探勘包含有某一項目組之效能評估 47
第七章 結論與未來發展 52
7.1研究結論 52
7.2研究貢獻 52
7.3未來方向 53
參考文獻 54
1Agrawal, R. and Srikant, R., “Fast Algorithms for Mining Association Rules in Large Database, ” Proceedings of the 20th International Conference on Very Large Data Bases, pp. 487-499, 1994.
2Srikant, R. and Agrawal, R., “Mining Generalized Association Rules, ” Proceedings of the 21th International Conference on Very Large Data Bases, pp. 407-419, 1995.
3Srikant, R. and Agrawal, R., “Mining Quantitative Association Rules in Large Relational Tables,” Proceedings of the 1996 ACM SIGMOD Conference on Management of Data, pp. 1-12, 1996.
4Han, J., Pei, J. and Yin, Y., “Mining Frequent Patterns without Candidate Generation, ” Proceedings of the 2000 ACM SIGMOD international conference on Management of data, pp. 1-12, 2000.
5Laudon, K. C. and Laudon, J. P., Management Information Systems, Sixth Edition, Upper Saddle River, NJ: Prentice Hall, 2000.
6Berry, M. J. A. and Linoff, G., Data Mining Technique for Marketing, Sale, and Customer Support, New York:John Wiley Computer, 1997.
7Agrawal, R. and Srikant, R.,. “Fast Algorithms for Mining Association Rules”. In Proc. of the VLDB Conference, 1994.
8Iko P., Masaru ., “FPtax : Tree Structure Based Generalized Association Rule Mining”, DMKD ’04, June 13, 2004.
9Quinlan, J. R., “Induction of Decision Trees, ” Machine Learning, Vol.1, pp. 81-106, 1986
10Ng, R. and Han, J., “Efficient and Effective Clustering Method for Spatial Data Mining, ” Proc. Int’l Conf. Very Large Data Bases, pp. 144-155, Santiago, chile, Step, 1994.
11Lai, C. L. and Yang, C. T., “Construct a Grid Computing Environment on Multiple Linux PC Clusters, ” Tunghai Science Vol. 5: pp.107−124 July, 2003
12Tsai, S. T. and Yang, C. T., “Decision Tree Construction for Data Mining on Grid Computing,” IEEE International Conference on e-Technology, e-Commerce and e-Service 2004
13Agrawal, R. and Srikant, R., “Mining Sequential Patterns,” Proc. of the Int’l Conference on Data Engineering, Taipei , Taiwan, March 1995
14Wur, S.Y. and Leu, Y., “An Effective Boolean Algorithm for Mining Association Rules in Large Databases, ” DASFAA, pp. 179-186, 1999.
15.鄭滄祥、魏志平、蕭漢威、齊玉美,非對稱性分類分析之實證評估,第十四屆國際資訊管理學術研討會,民國92年。
16.顏秀珍,李御璽,王思穎,從交易資料庫中挖掘客戶的購物行為,第十四屆物件導向技術及應用研討會,民國92年。
17.賴春松,提昇資料探勘效率於企業行銷之應用,南台科技大學資訊管理研究所,碩士論文,民國91年。
18.賴瓊惠,使用布林演算法找出在大型資料庫中多階層序列型樣,台灣科技大學資訊管理研究所,碩士論文,民國90年。
19.陳垂呈,應用布林運算快速分群化交易項目,TANET 2001(台灣區網際網路研討會),民國90年。
20.陳東堅,利用有效率的方法提升高頻型樣樹之探勘關聯規則之效能,南台科技大學資訊管理研究所,碩士論文,民國92年。
21.陳垂呈,以有效率分群化演算法發掘消費者最適性之產品項目,TANET 2002 (台灣區網際網路研討會),民國91年。
22.陳垂呈,陳俊堯,有效率的線上探勘關聯規則,第四屆產業資訊管理學術暨新興科技實務研討會,民國92年。
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔