跳到主要內容

臺灣博碩士論文加值系統

(3.231.230.177) 您好!臺灣時間:2021/07/27 10:15
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:胡博倫
研究生(外文):Hu Po Lun
論文名稱:一個挖掘特徵規則的資料探勘系統
論文名稱(外文):A Data Mining System for Discovering Characteristic Rules
指導教授:顏秀珍顏秀珍引用關係
指導教授(外文):Show-Jane Yen
學位類別:碩士
校院名稱:輔仁大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2004
畢業學年度:92
語文別:中文
論文頁數:33
中文關鍵詞:資料探勘關聯規則特徵規則結構化查詢語言
外文關鍵詞:Data MiningAssociation rulescharacteristic rulesSQL
相關次數:
  • 被引用被引用:0
  • 點閱點閱:131
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
資料探勘(data mining)技術於近十幾年來開始蓬勃發展,目的是要從資料庫中找出隱含於其中的有用資訊,其中關聯規則探勘(Association rule Mining)一開始的發展是為了挖掘出具有高度關聯性的規則並加以應用,但是我們發現關聯規則探勘在某些應用上會發生不適合的情況,例如決策者可能希望針對特定消費項目的客戶群進行電話行銷,所以必須找出消費者特徵與消費項目之間的關聯性,可是傳統的關聯規則探勘可能無法正確地找出其中的關聯性,原因有兩個,第一:資料內部可能存在大量不平衡的消費項目,例如日常用品的消費次數比起珠寶金飾等,就有很大的差距,像這樣的情況,很難產生出消費項目是珠寶金飾的規則,另外由於消費日用品的次數太多,導致無法找到日用品真正的消費特徵,第二:在資料庫中,某一類型之消費特徵的人特別多,導致此消費特徵在每一類的消費項目可能出現很多次,使得其可能成為很多消費項目的主要消費特徵,因此這樣的消費特徵在任何消費項目上,均不具代表性,所以我們提出特徵規則探勘(Characteristic rules Mining)演算法,引用卡方分析法來評估資料之間的關聯性並改良關聯規則中支持度的計算方式,幫助決策者了解隱含於資料內的訊息,進而改善管理或制定新的行銷策略。
  另一方面,資料探勘技術的發展上,針對實務研究的例子甚少,包括從探勘計畫、資料來源整合、資料前處理、評估探勘結果...等以及完整地討論與提供整體解決方法,其原因有1.取得大量實際資料的困難,2.發展出來的探勘演算法並未與資料庫管理系統緊密結合,以致於在現實環境下探勘系統的可用度不高,在本篇論文裡,我們針對上述問題提出解決方案,實作一套以Microsoft SQL Server為後盾的資料探勘系統CRM,整合了前處理、邊界值過濾、視覺化工具、動態量化...等功能,並且與銀行合作,取得實際信用卡消費的紀錄作為實驗的資料來源,結果顯示CRM系統具有良好的穩定性與挖掘能力。
Chapter 1 導論....................................1
1.1 系統介紹................................1
1.2 問題說明................................2
1.3 內容編排................................4
Chapter 2 相關工作................................5
2.1 關聯規則................................5
2.2 規則摘要................................7
Chapter 3 特徵規則演算法說明......................8
3.1 新的支持度計算方式......................8
3.2 卡方分析................................9
3.3 特徵規則演算法.........................11
Chapter 4 規則摘要演算法.........................15
Chapter 5 CRM系統功能介紹........................17
5.1 主畫面.................................17
5.2 動態離散化與界外值過濾功能.............19
5.3 規則摘要功能...........................24
Chapter 6 實驗報告...............................27
6.1 執行時間分析...........................27
6.2 規則摘要分析...........................29
Chapter 7 結論與未來工作.........................30
參考文獻.........................................31
[1] R. Agrawal and K. Shim: "Developing tightly-coupled data mining applications on a relational database system." In Proc. of the 2nd Int’l Conference on Knowledge Discovery in Databases and Data Mining, Portland, Oregon, August 1996./cs/quest.
[2] R. Agrawal, R. Srikant: "Fast Algorithm for Mining Association Rules." International Conference on Very Large Data Bases, pp.487-499, Sept. 1994.
[3] V. Barnett, T. Lewis: "Outliers in Statistical Data." John Wiley and Sons, NY 1994.
[4] Breiman, L., Friedman, J., Ohlsen, R., and Stone. C: "Classification and regress trees." Wadsworth & Brooks, Pacifc Grove, CA, 1984.
[5] J. Han, Y. Fu, K. Koperski, W. Wang, and 0. Zaiane: "DMQL: A data mining query language for relational datbases." In Proc. of the 1996 SIGMOD workshop on research issues on data mining and knowledge discovery, Montreal, Canada, May 1996.
[6] J. Han, Jian Pei, Yiwen Yin: "Mining frequent patterns without candidate generation." ACM International Conference on Management of Data (SIGMOD), Paper ID : 196, May 2000.
[7] Klemetinen, M., Mannila, H., Ronkainen, P., Toivonen,H., and Verkamo, A.I: "Finding interesting rules from large sets of discovered association rules." CIKM-1994.
[8] Langley, P., Iba, W., and Thomson, K: "An analysis of Bayesian classifiers." Proceeding of National Conference on Artificial Intelligence (AAAI-92), pp. 223-228, 1992.
[9] W. Li, J. Han, and J. Pei: ''CMAR: Accurate and Efficient Classification Based on Multiple Class-Association Rules.'' Proc. 2001 Int. Conf. on Data Mining (ICDM'01), San Jose, CA, Nov. 2001.
[10] Bing Liu, Yiming Ma, Ching-Kian Wong, and Philip S. Yu: "Scoring the Data Using Association Rules." Applied Intelligence, Vol 18, No. 2, 119-135, 2003.
[11] B. Liu, W. Hsu, and Y. Ma: "Integrating classification and association rule mining." KDD-98, 1998, pp. 80-86.
[12] B. Liu, W. Hsu, and Y. Ma: "Summarizing the discovered associations using direction setting rules." Technical Report, SoC, 1999.
[13] B. Liu, W. Hsu, and Y. Ma: "Pruning and Summarizing the discovered associations." KDD-99, 1999.
[14] B. Liu, M. Hu, and W. Hsu: "Multi-level organization and summarization of the discovered rules." Proc. ACM SIGKDD, 208-217, 2000.
[15] Mills, F. Statistical Methods, Pitman, 1955.
[16] Paul Nielsen: "Microsoft SQL Server 2000 Bible with CD-ROM." John Wiley & Sons.
[17] J.S. Park, M.S. Chen, and P.S. Yu: "An effective hash-based algorithm for mining association rules." In SIGMOD'95, pp. 175-186.
[18] Quinlan, R: "Bagging, Boosting, and C4.5." Proceeding of National Conference on Artificial Intelligence (AAAI-96), pp. 725-730, 1996.
[19] S. Sarawagi, S. Thomas, and R. Agrawal: "Integrating association rule mining with relational database systems: Alternatives and implications." In SIGMOD'98, pp. 343-354.
[20] A. Savasere, E. Omiecinski, and S. Navathe: "An efficient algorithm for mining association rules in large databases." In VLDB'95, pp. 432-443.
[21] Toivonen, H. Klemetinen, M., Ronkainen, P., Hatonen,K., and Mannila, H: "Pruning and grouping discovered association rules." Mlnet Workshop on Statistics, Machine Learning, and Discovery in Databases, 1995, p.47-52.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊