跳到主要內容

臺灣博碩士論文加值系統

(3.239.4.127) 您好!臺灣時間:2022/08/16 02:10
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:毛立仁
研究生(外文):Lih-Ren Mao
論文名稱:動態新增資料集中敏感性資料挖掘技術之研究
論文名稱(外文):Using A Novel Incremental Mining Algorithm to Discover Sensitive Information
指導教授:邱宏彬邱宏彬引用關係
指導教授(外文):Hung-Pin Chiu
學位類別:碩士
校院名稱:南華大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:66
中文關鍵詞:資料挖掘動態資料挖掘敏感性資料
外文關鍵詞:data miningMUMSUMdynamic data miningsensitivity data mining
相關次數:
  • 被引用被引用:3
  • 點閱點閱:247
  • 評分評分:
  • 下載下載:49
  • 收藏至我的研究室書目清單書目收藏:2
資料挖掘為近年來客戶資源管理、行銷、醫學及其他許多領域中,將使用者有興趣的資料擷取出來的一門學科,而資料擷取的方式亦分為分群法、分類法、關聯法則擷取法等相關的方式。
在資料挖掘的學術領域中,最早被提出來的演算法即為Apriori演算法,它利用反覆讀取資料庫中關聯性資料的方式,將資料擷取出來,取得屬性之間的關聯法則,但對於現實生活中動態新增的資料庫而言,Apriori面臨了三個主要的問題,其一為大型資料庫挖掘曠日耗時,且無法即時更改支持度;二為無法有效解決資料庫中動態新增資料挖掘的問題,第三為相對於整體資料庫,較新時間點的敏感性資料無法做一個有效的擷取。
本篇論文提出兩種新的演算方式,其一為MUM (Multidimensional Update Mining)演算法,可在動態資料庫中即時挖掘出項目之間的關聯法則,以改善Apriori演算法在資料挖掘時效率不佳及無法動態挖掘新增資料庫的問題。另一種是SUM (Sensitivity Update Mining) 演算法,該演算法建立在MUM之上,用以即時挖掘敏感性資料的關聯法則,改進以往演算法必須批次處理大筆資料的問題。此兩種演算法對於目前動態新增的資料庫挖掘,提供了一個有效率的動態即時敏感性資料挖掘方式,避免敏感性資料因為無法在短期間內達到使用者設定的最小支持度而被捨棄的問題。

Data mining is the exploration and analysis of large quantities of data in order to discover meaningful patterns and rules. It is an important discipline that has widely applied in fields ranging from customer relationship management to marketing, and medicine.
The discovery of association rules is an important task in data mining. The Apriori algorithm is the most popularly and widely used technique for mining association rules. However, the Apriori algorithm must scan the databases many times to discover the large itemsets so that it has three main disadvantages: (1) it is time-consuming; (2) it is not suitable for mining of incrementally growing databases due to the need of rescanning the original databases; and (3) as databases grow, the sensitive information in the new transactions can not mined effectively.
In this thesis, we propose the Multidimensional Update Mining (MUM) algorithm, which does not need to rescan the original database, to mine the association rules for the incrementally growing databases. Based on the MUM algorithm, a Sensitivity Update Mining (SUM) algorithm is designed to mine sensitive information from the newly inserted transactions. Many experiments and related analysis are conducted to validate our proposed approaches.

書名頁……………………………………………………………………… i
博碩士論文授權書………………………………………………………… ii
論文指導教授推薦函 …………………………………………………… iii
論文口試合格証明 ……………………………………………………… iv
中文摘要…………………………………………………………………… v
英文摘要…………………………………………………………………… vi
誌謝 ……………………………………………………………………… vii
目錄 …………………………………………………………………… viii
表目錄 ……………………………………………………………………… x
圖目錄 …………………………………………………………………… xi
第一章 緒論 …………………………………………………………… 1
第一節 資料挖掘的定義 ……………………………………………… 1
第二節 資料挖掘的方法 ……………………………………………… 5
第三節 資料挖掘的應用 ……………………………………………… 6
第四節 研究動機與目的 ……………………………………………… 7
第五節 研究方法 ……………………………………………………… 8
第二章 相關研究 ……………………………………………………… 10
第一節 關聯法則資料挖掘的演算方式 …………………………… 10
2.1.1 Apriori演算法 …………………………………………………… 10
2.1.2 DHP 演算法 ……………………………………………………… 14
2.1.3 DIC演算法 ………………………………………………………… 16
2.1.4 Partition演算法 ………………………………………………… 18
2.1.5 Sampling 演算法 ………………………………………………… 20
第二節 動態資料庫挖掘相關演算方式 …………………………… 21
2.2.1 FUP演算法 ………………………………………………………… 21
2.2.2 Pre-Large Itemsets Mining …………………………………… 25
2.2.3 縮減項目集絡挖掘方式 ………………………………………… 27
第三節 其他資料挖掘相關的法則 …………………………………… 30
2.3.1 廣義性之關聯法則 ……………………………………………… 30
2.3.2 負面性之關聯法則 ……………………………………………… 31
2.3.3 Apriori法則與應用 ……………………………………………… 32
2.3.4 儲存空間與即時線上挖掘 ……………………………………… 33
第三章 動態資料挖掘演算法之研究 ………………………………… 35
第一節 MUM演算法技術之探討 ……………………………………… 35
第二節 MUM演算法之推導過程 ……………………………………… 37
第三節 MUM 演算法之實作研究 ……………………………………… 43
第四節 MUM 演算法與Apriori演算法之討論與比較………………… 45
第四章 敏感性資料挖掘演算法之研究 ……………………………… 48
第一節 SUM演算法技術之探討 ……………………………………… 49
第五章 實驗結果與討論 ……………………………………………… 55
第一節 實驗架構與實驗數據 ………………………………………… 55
第二節 實驗結果探討 ………………………………………………… 57
第三節 MUM演算法之後續探討 ……………………………………… 59
第六章 結論與未來研究方向 ………………………………………… 62
第一節 結論 …………………………………………………………… 62
第二節 未來研究之方向 ……………………………………………… 63
參考文獻 ………………………………………………………………… 66

1.M. S. Chen, J. Han, and P.S. Yu, "Data Mining: An Overview from a database Perspective", IEEE Transaction on Knowledge and Data Engineering, Vol. 8,No. 6,December 1996.
2.L. Kaufman and P. J. Rousseeuw, "Finding Groups in Data: an Introduction to Cluster Analysis", John Wiley & Sons, 1990.
3.S. M. Weiss and C. A. Kulikowski, "Computer System that Learn: Classification and Prediction Method from Statistics, Neural Nets, Machine Learning, and Expert System", Morgan Kaufman,1991.
4.R. Agrawal and R. Srikant, "Mining Sequential Patterns", IEEE ICDE, pp. 3-14, 1995.
5.R. Agrawal and R. Srikant, "Fast algorithm for mining association rules", the International Conference on Very Large Database, pp. 487-499, 1994.
6.R. Agrawal, R. Srikant, and Q. Vu, "Mining association rules with item constraints", in 3th International Conference on Knowledge Discovery in Database and Data Mining, Newport Beach, California, 1997.
7.M. S. Chen, J. S. Park, and P. S. Yu, "Efficient Data Mining for Path Traversal Patterns", IEEE Transactions on Knoeledge and Data Engineering, Vol. 10, No. 2, 1998.
8.R. Agrawal and R. Srikant, "Fast Algorithm for Mining Assoication Rule in Large Databases", In Proc. 1994 Int’l Conf. VLDB, pp. 487-499, Santiago, Chile, Sep. 1994.
9.Savasere, E. Omiecinski, and S. Navathe, "An Efficient Algorithm for Mining Association Rule in Large Database", Proc. 21th VLDB,pp. 432-444, 1995.
10.T. Fukuda, Y. Morimoto, S. Morishita, and T. Tokuyama, "Mining optimized association rules for numeric attributes", the ACM SIGACT—SIGMOD -SIGART Symposium on Principles of Database Systems, pp. 182-191,1996.
11.D. W. Cheung, S. D. Lee, and B. Kao, "A general incremental technique for maintaining discovered association rules", in Proceedings of Database Systems for Advanced Applications, DASFAA’97, Melbourne, Australia, pp. 185-194, 1997.
12.H. Toivonen, "Sampling Large Database for association Rule", VLDB, pp. 134-145, 1996.
13.J. S. Park, M. S. Chen, and P. S. Yu, "An Effective Hash Based Algorithm for Mining Association Rules", Proc. ACM SIGMOD, pp. 175-186, 1995.
14.S. Brin, R. Motwani, J. D. Ullman, and S. Tsur, "Dynamic Itemset Counting and Implication Rules for Marketing Basket Data", 1997 ACM SIGMOD Conference on Management of Data, pp. 255-264, 1997.
15.B. Dunkel and N. Soparkar, "Data Organization and Access for Efficient Data Mining", ICDE 1999, Sydney, Australia.
16.D.Kenny and J. F. Marshall, "Contextal Marketing", Harvard Business Review, Nov-Dec, 2000.
17.R. Srikant and R. Agrawal, "Mining Generalized Association Rules", Proc. Of the 21st Int’l Conference on VLDB, pp. 407-419, Zurich, Switzerland, Sep 1995.
18.A. Savasere, E. Omiecinski and S. Navathe, "Mining for Strong Negative Associations in a Large Database of Customer Transactions", In Proc. of the IEEE 14th int. Conference. On Data Engineering, Orlando, FL, Feb 1998(forthcoming).
19.王慶堯,民國89年,利用準大項目集之漸進式挖掘,義守大學資訊工程研究所碩士論文。
20.許智豪,民國89年,在動態資料庫中作線上挖掘關聯式法則,國立中興大學資訊科學研究所碩士論文。

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 58. 楊蓓:各領域社會工作人員工作壓力、社會支持與職業倦怠之研究.中華心理衛生學刊 4(2),85-101,1988.
2. 48. 陳愛娟:企業員工的壓力、倦怠與人力再造:員工協助方案的實施.僑光學報 16:77-91,1998.
3. 38. 林炎旦:國民小學教師教學倦怠之研究.國民教育研究學報 1,57-84, 1995.
4. 37. 蔡金田:國民小學啟智班教師工作壓力與職業倦怠之關係.教育研究資訊 6(6):69-87,1998.
5. 36. 葉在庭:負向情緒調適量表與職業倦怠關係之初探.測驗與輔導 165:3477-3479,2001.
6. 34. 郭生玉:影響教師工作心厭因素之分析研究.教育心理學報 27:63-79,1994.
7. 33. 李選:臨床護理人員壓力感、疲潰與自我主見度之探討.護理雜誌 36(1):85-98,1989.
8. 32. 張添洲:工作壓力與生涯耗竭.勞工行政 130:53-55,1999.
9. 31. 張曉春:專業人員工作疲乏研究模式:以社會工作者為例(上).思與言 21(1):66-79,1983.
10. 20. 陳潭:醫師人員之工作壓力與離職傾向之相關研究.東海學報 37:1-17,1996.
11. 16. 陸洛:工作壓力之歷程:理論與研究的對話.中華心理衛生學刊 10(4):19-51,1997.
12. 14. 李芳庚、林子准:牙科醫療糾紛.牙醫學雜誌 15(2):105-109,1995.
13. 60. 陸洛、高淑芳:主管工作壓力的族群差異:個人背景、工作與職業因素.中華心理衛生學刊 12(2):23-66,1999.
14. 66. 林信昌、臧國仁:新聞從業人員之王作倦怠現象-以台北市平面媒會路線記者為例.新聞學研究63:91-135,2000.
15. 67. 吳宗立:國中學校行政人員工作壓力與因應策略之研究.國教學報 8:99-131,1996.