(3.238.173.209) 您好!臺灣時間:2021/05/09 17:04
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:劉玉敏
研究生(外文):Yu-Min Liu
論文名稱:線上漸進式網站使用探勘之研究-以產品推薦為例
論文名稱(外文):A study of Online Incremental Web Usage Mining-The Case of Product Recommendation
指導教授:黃錦法黃錦法引用關係
指導教授(外文):Ching-Fa Huang
學位類別:碩士
校院名稱:國立雲林科技大學
系所名稱:資訊管理系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2003
畢業學年度:91
語文別:中文
論文頁數:105
中文關鍵詞:關聯法則漸進式探勘產品推薦網站使用探勘
外文關鍵詞:Association Rule.Incremental MiningProduct RecommendationWeb Usage Mining
相關次數:
  • 被引用被引用:12
  • 點閱點閱:211
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
網際網路與電子商務的快速發展,使得消費者能藉由進步的資訊科技,方便地在網路上進行購物活動。目前網站使用探勘研究,大多是利用網站日誌檔為資料來源,以離線批次處理的方式進行資料前處理與行為特徵探勘,將探勘出的行為特徵應用於線上推薦。使用網站日誌檔來進行探勘,會有資料過於雜亂,必須經過多道資料前處理步驟的問題,而利用離線批次處理的探勘方式,當有新的使用者行為資料產生時,會有無法僅針對新增的行為資料進行探勘的問題。

本研究提出新的線上漸進式網站使用探勘方法論,此方法論利用線上即時記錄使用者使用網站的過程解決使用網站日誌檔的問題,並且利用線上漸進式探勘方式改善無法僅針對新增的行為資料進行探勘的問題。另外,為使本研究所提出的方法論能有效支援網站經營者及使用者進行產品推薦,也實際設計及開發以本研究所提方法論為基礎的支援系統。經實例試用及兩個禮拜系統實驗結果,本研究的產品推薦支援系統,就系統執行效能而言,瀏覽推薦比例為97.9%,購物車推薦比例為92.8%,整體瀏覽推薦時間平均為4.16秒,整體購物車推薦時間平均為0.52秒,整體瀏覽探勘時間平均為12.83分,整體購物車探勘時間平均為1.41分;就系統推薦效益而言,整體推薦精確度為37.4%,整體推薦涵蓋率為80%,整體推薦F1指標為51%。
As the rapid development of the E-Commerce and Internet, it is possible that consumers can go shopping online conveniently. Most of the studies of web usage mining are using web server log as data source, and using the offline batch process to proceed data pre-processing and pattern mining, and apply the pattern to the online recommendation. However, using the web server log as mining data source, have to take many preprocessing task to eliminate irrelevant items, and using the offline batch process to mining patterns would cause the problem of couldn’t only deal with the newly inserted transactions.

In this study, we proposed a new online incremental web usage mining methodology, which utilized keeping track of user's browsing behavior in real time to solve the problem of using web server log, and utilized online incremental mining to solve the problem of traditional mining method which couldn't only deal with the newly inserted transactions. We also developed a supportive system based on the methodology to proceed experiment. For two weeks of the experiment, the evaluation result show that:

In the perspective of system executing performance, the browsing recommendation ratio was 97.9%, and the shopping cart recommendation ratio was 92.8%, and the average of overall browsing recommendation time was 4.16 seconds, and the average of overall shopping cart recommendation time was 0.52 second, and the average of overall browsing mining time was 12.83 minutes, and the average of overall shopping cart mining time was 1.41 minutes.In the perspective of system recommendation benefit, the overall recommendation precision was 37.4%,and the overall recommendation coverage was 80%,and the overall F1 was 51%.
目錄
中文摘要 i
英文摘要 ii
致謝 iii
目錄 iv
表目錄 vi
圖目錄 vii
一、緒論 1
1-1 研究背景 1
1-2 研究動機 2
1-3 研究目的 3
1-4 論文架構 4
二、文獻探討 5
2-1 Web Mining的定義與分類 5
2-2 網站使用探勘的流程 6
2-2-1 離線流程 6
2-2-3 線上流程 13
2-3 資料探勘技術於網站使用探勘的應用 14
2-3-1 關聯法則(Association Rule) 14
2-3-2 分類 18
2-3-3 群集分析(Clustering) 18
2-3-4 序列型樣(Sequence Pattern) 19
2-4 漸進式探勘 19
三、線上漸進式網站使用探勘方法論 23
3-1 線上漸進式網站使用探勘方法論架構 23
3-2 線上即時推薦 25
3-2-1 線上記錄 25
3-2-2 瀏覽序列與購物車 25
3-2-3 即時推薦引擎 26
3-2-4 瀏覽推薦集合與購物車推薦集合 34
3-3 線上漸進式探勘 35
3-3-1 原始瀏覽記錄及原始購物車記錄 35
3-3-2 漸進式探勘引擎 35
3-3-3 關聯法則項目集資料庫 38
3-4 方法論 40
四、線上漸進式網站使用探勘支援系統 46
4-1 系統設計原則 46
4-2 系統架構 47
4-3 系統開發 51
4-3-1 系統實作 51
4-3-2 實例試用 54
五、評估分析 60
5-1 系統實驗評估分析 60
5-1-1系統實驗評估指標 60
5-1-2 系統實驗評估結果 68
5-2 相關系統比較分析 77
六、結論 85
6-1 結論 85
6-2 未來研究方向 86
參考文獻 87
附錄一:瀏覽序列長度分佈表 90
附錄二:瀏覽序列長度及MFR資料量對瀏覽推薦時間影響表 91
附錄三:購物車序列長度分佈表 92
附錄四:購物車序列長度與購物車序列資料量對購物車推薦時間影響表 93
附錄五:MFR資料量中MFR長度分佈表 94
附錄六:MFR長度與MFR資料量對瀏覽探勘時間影響表 95
附錄七:購物車序列資料量中購物車序列長度分佈表 96
附錄八:購物車序列長度與購物車序列資料量對購物車探勘時間影響表 97

表目錄
表2- 1 網站日誌檔的片段 8
表2- 2 使用者辨識的機制 11
表2- 3 使用MF演算法的相關研究 13
表2- 4 Support值和Confidence值代表的意義 15
表2- 5 MUM演算法資料表格式 20
表2- 6 MUM演算法實驗數據比較表(單位:秒) 21
表2- 7 線上探勘時實驗數據比較表(單位:秒) 21
表4- 1 線上漸進式網站使用探勘支援系統架構圖與線上漸進式網站使用探勘支援系統結構圖比較表 54
表5- 1 MFR資料量對瀏覽推薦比例影響表 69
表5- 2 購物車序列資料量對購物車推薦比例影響表 71
表5- 3 推薦方法精確度評估一覽表 75
表5- 4 推薦方法涵蓋率評估一覽表 76
表5- 5 F1指標評估一覽表 76
表5- 6 網站探勘分類比較表 79
表5- 7 探勘流程技術比較表 83

圖目錄
圖1- 1 研究架構圖 4
圖2- 1 Web Mining的分類 5
圖2- 2 網站使用探勘的一般架構 6
圖2- 3 網站使用探勘前處理細部流程 9
圖2- 4 網頁代理伺服器與瀏覽器硬碟快取間讀取網頁的關係 10
圖2- 5 使用者瀏覽路徑範例 12
圖2- 6 MF演算法 13
圖2- 7 Apriori演算法 16
圖2- 8 apriori-gen函數 17
圖2- 9 Apriori演算法之推導範例 17
圖2- 10 交易項目拆解樹狀圖 21
圖2- 11 MUM演算法與Apriori演算法之比較 22
圖3- 1 線上漸進式網站使用探勘方法論架構圖 24
圖3- 2 【線上即時推薦及漸進式探勘】流程圖 40
圖4- 1 線上漸進式網站使用探勘支援系統架構圖 47
圖4- 2 線上漸進式網站使用探勘支援系統結構圖 54
圖4- 3 【最常瀏覽推薦】與【最常購物車推薦 】畫面 56
圖4- 4 【分類最常瀏覽推薦】與【分類最常購物車推薦】畫面 57
圖4- 5 【線上即時瀏覽推薦-瀏覽關聯法則推薦】畫面 57
圖4- 6 【線上即時瀏覽推薦-瀏覽產品分類推薦】畫面 58
圖4- 7 【線上即時購物車推薦-購物車關聯法則推薦】畫面 58
圖4- 8 【線上即時購物車推薦-購物車互補產品推薦】畫面 59
圖5- 1 MFR資料量對瀏覽推薦比例的影響 70
圖5- 2 瀏覽序列長度與MFR資料量對瀏覽推薦時間的影響 70
圖5- 3 MFR資料量與瀏覽推薦時間趨勢圖 71
圖5- 4 購物車序列資料量對購物車推薦比例的影響 71
圖5- 5 購物車序列長度與購物車序列資料量對購物車推薦時間的影響 73
圖5- 6 購物車序列資料量與購物車推薦時間趨勢圖 73
圖5- 7 MFR長度與MFR資料量對瀏覽探勘時間的影響 73
圖5- 8 MFR長度與瀏覽探勘時間趨勢圖 73
圖5- 9 購物車序列長度與購物車序列資料量對購物車探勘時間的影響 74
圖5- 10 購物車序列長度與購物車探勘時間趨勢圖 74
[ 1] 吳凱雯,2001,利用資料挖掘技術提供網際網路使用者個人化服務,靜宜大學,碩士論文。
[ 2] 李政權,2001,使用資料探勘技術進行文件推薦-以設計FAQ推薦系統為例,中原大學,碩士論文。
[ 3] 杜宜潔,2002,整合網站使用探勘與網站內容探勘-建構線上個人化新聞資訊推薦系統之研究,輔仁大學,碩士論文。
[ 4] 邱毓蘋,2000,資訊豐富度對網路購物意願之研究,交通大學,碩士論文。
[ 5] 張忠琦,2001,資料探勘於網站使用與網頁內容探索之研究,輔仁大學,碩士論文。
[ 6] 許智豪,2002,動態資料庫中作線上挖掘關聯式法則,中興大學,碩士論文。
[ 7] 陳仕昇,1998,以可重複序列挖掘網路瀏覽規則之研究,中央大學,碩士論文。
[ 8] 陳佳源,2001,發展基於使用者行為導向之智慧型財經資訊系統,交通大學,碩士論文。
[ 9] 陳和興,2002,企業顧客關係管理之應用-整合式智慧型企業網站之研究,輔仁大學,碩士論文。
[10] 楊昇樺,毛立仁,邱宏彬,2002,”關聯法則之多層更新挖掘法及其應用,第三屆資訊管理暨新興科技研討會”,11月30日。
[11] 楊煜愷,2001,以完全項目集合演算法挖掘與分析使用者瀏覽行為,暨南大學,碩士論文。
[12] 葉隆憲,陳垂呈,2001,”資料探勘技術在建構適性化租屋網站上之應用-以府城地區學生租屋為例”,TANET2001,10月25日。
[13] 劉仲原,2002,個人化網頁推薦系統之研究-以歷史博物館為例,國立雲林科技大學,碩士論文。
[14] 潘瓊如,2000,時間性路徑追蹤樣式之資料挖掘,臺灣大學,碩士論文。
[15] 鄭旭峰,2000,運用資料挖掘技術於個人化網路廣告系統之建置,逢甲大學,碩士論文。
[16] Alex Nanopoulos and Yannis Manolopoulos, 2000, "Finding Generalized Path Patterns for Web Log Data Mining", In Proceedings of East-European Conference on Advances in Databases and Information Systems, pp.215—228.
[17] Bamshad Mobasher, Bettina Berendt, Myra Spiliopoulou, 2001, "KDD for Personalization", PKDD 2001 Tutorial, Septmber 6.
[18] Bamshad Mobasher, Honghua Dai, Tao Luo, Miki Nakagawa, 2002, "Discovery and Evaluation of Aggregate Usage Profiles for Web Personalization", In Data Mining and Knowledge Discovery, Kluwer Publishing, Vol. 6, No. 1, pp. 61-82, January.
[19] Bamshad Mobasher, Robert Cooley, Jaideep Srivastava, 2000, "Automatic Personalization Based on Web Usage Mining", Communications of The ACM, vol.43, pp.142-151, August.
[20] D.W. Cheung, S.D. Lee , and B. Kao , 1996, "Maintance of discovered association rules", Proc. Of the IEEE ICDE, pp.106-114.
[21] David Cheung, Ben Kao, Joseph Lee, 1997, "Discovering User Access Patterns on the World-Wide Web", First Pacific Asia Conference on Knowledge Discovery and Data Mining, pp.23-24,February.
[22] Guiltinan, Joseph P., 1987, “The Price Bundling of Services: A Normative Framework.”,Journal of Marketing, April, pp. 74-85.
[23] Jaideep Srivastava, Robert Cooley, Mukund Deshpande, Pang-Ning Ten, 2000, "Web Usage Mining: Discovery and Application of Usage Patterns from Web Data", ACM SIGKDD, vol. 1, pp.12-21, Jan.
[24] Jiawei Han, Micheline Kamber, 2001, Data Mining : Concepts and Techniques, Morgan Kaufmann Publishers.
[25] Lewbel, A., 1985, “Bundling of Substitutes or Complement.”International Journal of Industrial Organization, Vol. 3, pp.101-107.
[26] Mike Perkowitz, Oren Etzioni, 1999, "Towards Adaptive Web Site: Conceptual Framework and Case Study", Proceeding of WWW8.
[27] Ming-Syan Chen,Jong Soo Park,Philip S. Yu, 1998, "Efficient Data Mining for Path Traversal Patterns",IEEE Transactions On Knowledge And Data Engineering, vol. 10,no.2., pp.209-221.
[28] O. Etzioni, 1996, "The world wide web: Quagmire or gold mine", Communications of the ACM, vol. 39, pp.65-68.
[29] R. Agrawal, R.Srikant, 1994, ”Fast Algorithm for Mining Association Rules in Large Databases,” in Proc. of The 20th International Conference on Very Large DataBases.
[30] R. Cooley, B.Mobasher and J. Srivastava, 1997, "Web Mining: Information and Pattern Discovery on the World Wide Web", In Proceeding of ICTAI'97.
[31] Raymond Kosala, Hendrik Blockeel,2000,"Web Mining Research: A Survey", SIGKDD Explorations,vol. 2, pp.1-15, July.
[32] Robert Cooley, Bamshad Mobasher, Jaideep Srivastava, 1999, "Data Preparation for Mining World Wide Web Browsing Patterns", Knowledge and Information Systems, vol. 1(1).
[33] S. Thomas, S. Bodagala, K. Alsabti, and S. Ranka, 1997, "An efficient algorithm for the incremental updation of association rules in large databases", Proc. Of the 3rd KDD97, pp.263-266.
[34] Salton, Gerard and McGill, Michael J., 1983. Introduction to Modern Information Retrieval. New York: McGraw-Hill Co.
[35] Yao Y.Y., Hamilton H. J., and Wang X.W. , "PagePrompter: An Intelligent Agent for Web Navigation Created Using Data Mining Techniques", Technical report CS-2000-08, Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada.
[36] Yesil, M.,1997,Creating the virtual store,John Wiley & Sons,New York.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔