跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.13) 您好!臺灣時間:2025/11/24 06:20
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:羅元禧
研究生(外文):Lo Yuan Hsi
論文名稱:關聯規則在WebMining的應用研究
論文名稱(外文):The Association Rules used on Web Mining
指導教授:古永嘉古永嘉引用關係
指導教授(外文):Ku Yung Chia
學位類別:碩士
校院名稱:國立臺北大學
系所名稱:企業管理學系
學門:商業及管理學門
學類:企業管理學類
論文種類:學術論文
論文出版年:2003
畢業學年度:91
語文別:中文
論文頁數:72
中文關鍵詞:網路探勘關聯規則馬可夫鏈蒙地卡羅法
外文關鍵詞:Web miningAssociation ruleMarkov Chain Monte Carlo method
相關次數:
  • 被引用被引用:6
  • 點閱點閱:741
  • 評分評分:
  • 下載下載:119
  • 收藏至我的研究室書目清單書目收藏:6
面對網站人口和網站資料不斷增加的環境中,我們發現目前網站存有許多問題,幾乎呈現的網頁都是一般大眾化的網頁,網站的資訊內容呈現(Context provided)、網站結構(Web Structure)以及瀏覽路徑(Navigation Path) 又都是網站設計者所規範的,設計者只以自己本身的認知來設計網站,根本不確定設計者規範出的網站是否符合使用者本身的需求。
本研究將探討如何利用資料挖掘的一些方法對於自網際網路中取得的資料加以分析處理,我們將這些資料經過前置處理後,利用一些資料挖掘的方法與技術,如:關聯規則(association rule)。關聯規則係在網路探勘中的資料挖掘的技術之一,其主要是找出資料庫某些資料項目間彼此的關聯性。由於關聯規則的表現是相當明確、而且易懂,因此被大量廣泛的運用在各種不同的領域上。利用關聯式規則分析網站的登錄資料,分析之結果配合網站之架構使網站更符合使用者需求。
而在三種關聯規則方法的應用比較上,前兩種是以統計方法運用在web mining上,以求得網頁之關聯性,第一種機會比的方法,必須以兩兩成對的網頁類別分別做計算,在判斷其信賴區間是否包含零,以判定網頁的關聯性,係屬於一種邊際關聯,在實務應用上並不可行;而第二種方式是圖示化模型選擇法,並以log linear model求解,雖然可將所有網頁類別同時考量,但在高維度下導出最大概似值會有問題,結論將出現不為一、不穩定的現象,必須以第一種方式所求出的群組為基礎,因此仍舊不夠周延。最新發展出的馬可夫鏈蒙地卡羅法應用在web mining上,可解決以上的問題,並可一次考量11類網頁,求出網頁間的條件關聯圖。
我們利用台北大學企業管理學系伺服器的網站日誌檔,透過三種關聯規則方式來分析眾多使用者的瀏覽資訊,以提供顧客導向的服務、提供其所需的資訊;並可據此將網頁做適當的歸類,有助於網站架構的設計。
With the trend of increasing web population and data, there is existing a common problem that the pages provided on web are not distinguished with others. All of context provided, web structure and navigation path on web are regulated by the designator. The designator had set up the web only in his opinion, most of them can’t make sure if the context on web could fit user’s real demand.
This research would discuss how to analyze the data with Data Mining Method. We had dealt with these data in the first step, and then we would find out the relationship between the data, for instance, association rule. Association rule is one kind of the Data Mining Methods, its primary objective is to find out the association between some specific data items. Because it’s widely accepted by the public, it had been applied to several fields. Using association rule to analyze the registered data makes the result is much fit to general web’s users.
Comparing with these three kinds of association rule methods application, the former two methods are applied to web mining in order to find out web association. But the limitation of research method had made those methods application impossible. The second method is to make a solution with long linear method, but it still exists some problems that the conclusions are not in unanimity. The latest method is solve this problem with applying Markov Chain Monte Carlo method to web mining and could include the association between 11 pages in one time.
We had used the daily records of NTPU Business Administration Department web to support our research. With the three kinds methods to analyze many navigating information of web users to provide customer-orientation service and information needed. We could sort out these webs base on our conclusion and that would be helpful to set up webs.
目錄 I
表次 III
圖次 IV
第壹章 緒論 1
第一節 研究背景 1
第二節 研究動機 2
第三節 研究目的 4
第三節 研究範圍 5
第貳章 文獻探討 7
第一節 Web Mining 7
第二節 關聯規則 22
第三節 網路探勘相關研究 26
第四節 文獻探討總結 31
第參章 研究方法 32
第一節 研究流程 32
第二節 研究架構 33
第三節 研究設計 34
第四節 機會比 37
第五節 圖示化模型選擇法 40
第六節 貝氏圖示化模型選擇法 43
第肆章 實證結果與分析 52
第一節 邊際關聯結構探勘 52
第二節 條件關聯結構探勘 55
第伍章 結論與建議 62
第一節 結論 62
第二節 對網站設計者建議 64
第三節 後續研究者建議 65
第四節 研究限制 66
參考文獻 67
一、中文部分
1. APOL科技論壇特區網頁,網站經營利器(上),http://technology.apol.com.tw/technology-6.html
2. APOL科技論壇特區網頁,網站經營利器(下),http://technology.apol.com.tw/technology-7.html
3. 古永嘉譯,企業研究方法,華泰書局,民國85年。
4. 吳凱雯,利用資料挖掘技術提供網際網路使用者個人化服務,靜宜大學資訊管理學系碩士班論文,民國90年6月。
5. 李明德,網路廣告輪播系統之開發,中央大學機械工程研究所碩士論文,民國89年6月。
6. 李寬鴻,產品推薦模型之設計,淡江大學資訊工程學系碩士論文,民國90年6月。
7. 林文修(國立中央大學資訊管理系博士班),「Data Mining 探索(上)」,決策論壇(第13期),http://www.gss.com.tw/eis/13/13index.htm,民國87年4月。
8. 林文修(國立中央大學資訊管理系博士班),「Data Mining 探索(下)」,決策論壇(第14期),http://www.gss.com.tw/eis/14/14index.htm,民國87年7月。
9. 林東清,資訊管理-e化企業的核心競爭能力,智勝文化事業有限公司,初版,民國91年9月。
10. 張恭維,結合關聯法則與模糊叢聚之網際探勘架構,元智大學資訊管理學系碩士班論文,民國90年6月。
11. 陳明田,貝氏方法選取最佳模式---GARCH或門檻GARCH模式,逢甲大學統計與精算研究所碩士論文,民國91年6月。
12. 陳建銘,類神經網路於Web Mining之應用,台北科技大學商業自動化與管理研究所碩士論文,民國90年7月。
13. 曾宏平,運用資料挖掘技術發展建設公司企業知識-以售後服務資料庫為例,高雄第一科技大學營建工程系碩士論文,民國92年1月。
14. 曾義光,「網站經營利器:掌握淺在顧客以網際探勘(Web Mining)幫助決策判斷」,網際先鋒70,pp.32-36, 民國89年3月。
15. 程左一,台大資訊管理研究所,資訊管理研究所網站,http://adamchan.ceo.com.tw/。
16. 楊昇宏,資料挖掘應用於找尋瀏覽網頁之型樣,逢甲大學資訊工程研究所碩士論文, 民國89年6月。
17. 楊東麟,從限定項目個數及交易長度的資料中有效地找出關聯規則之研究,逢甲大學資訊工程學系碩士論文,民國91年6月
18. 楊煜愷,以完全項目集合演算法挖掘與分析使用者瀏覽行為,暨南國際大學資訊管理研究所碩士論文,民國90年6月。
19. 劉峰旗,具條件變異數異質性之自我迴歸模式其最佳子集之選取,逢甲大學統計與精算研究所碩士論文,民國91年1月。
20. 鄭婉儀,應用資料挖掘於交叉銷售之研究,國立台北大學企業管理學系碩士論文,民國九十一年六月。
21. 欒斌、羅凱揚,電子商務,滄海書局,修定版,民國90年1月。
22. 高明秀、許伯雄,類別資料分析,巨流圖書公司,一版,民國79年9月。
二、英文部分
1. Agresti, A., Categorical data analysis, USA:John Wiley & Sons, inc., 1990.
2. Avelino Gonzalez and Douglas Dankel, The Engineering of Knowledge-Based System. Englewood Cliffs, New Jersey:Prentice Hall, 1993.
3. Brooks, S.P., 1998. Markov Chain Monte Carlo Method and its Application. The Statistician 47, pp.69—100.
4. Cooley, R., Mobasher, B. and Srivastava, J., 「Web Mining:Information and Pattern Discovery on the World Wide Web」,Technical Report TR 97-027,University of Minnesota, Dept. of Computer Science , Minneapolis, 1997.
5. David Edwards, Tomas Havranek, 1985. A fast procedure for model search in multidimensional contingency tables, Biometrika 72, pp.339—351.
6. Dawid A. P., S. L. Lauritzen, 1993. Hyper Markov laws in the statistical analysis of decomposable graphical models, The Annals of Statistics 21, No.3, pp.1272—1317.
7. Fayyad, U., Piatesky-Shapiro, G. and Smyth, P., “The KDD Process for Extracting Useful Knowledge from Volumes of Data”, Communications of the ACM, Vol.39, No11, pp.27-34, Nov. 1996.
8. Gart, J. J., Zweiful, 1967. On the bias of various estimators of the logit and its variance with applications to quantal bioassay. Biometrika 54, pp.181—187.
9. Geman, S. and Geman, D. (1984) Stochastic relaxation, Gibbs distribution, and Bayesian restoration of images, IEEE Transaction, on Patter Analysis and Machine Intelligence,6, 721-741.
10. Giudici, P., Castelo, R., 2001. Association Models for Web Mining, Data Mining and Knowledge Discovery, 5, pp.183-196.
11. Giudici, P., Castelo, R., 2003. Improving Markov Chain Monte Carlo for data mining. Machine learning 50, pp.127-158.
12. Giudici, P., Green, P.J., 1999. Decomposable graphical gaussian model determination. Biometrika 86, pp.785—801.
13. Giudici, P., Passerone, G., 2002. Data Mining of association structures to model consumer behaviour, Computation Statistics&Data Analysis 38, pp.533—541.
14. Grupe, F.H. and M.M. Owrang, “Database Mining Discovering New Knowledge and Cooperative Advantage”, Information Systems Management, 1995.
15. Haldane, J. B. S.,1955. The estimation and significance of the logarithm of a ratio of frequencies. Ann. Human Genet. 20, pp.309—311.
16. Han, J. and M. Kamber, Data Mining:Concepts and Techniques, San Francisco, CA, USA:Morgan Kaufmann, 2000.
17. Han, J. and M. Kamber, Data Mining:Concepts and Techniques, SanFrancisco, CA, USA:Morgan Kaufmann, 2000.
18. Hastings, W. K. (1970) Monte-Carlo sampling methods using Markov chains and their applications, Biometrika, 57, 97-109.
19. Houston, Frank, 1986. The Marketing concept: What It Is and What Is Not, Journal of Marketing, April, pp.81—87.
20. Lauritzen, S., 1996. Graphical Models. Oxford University Press, Oxford.
21. Madigan, D., York, J., 1995. Bayesian graphical models for discrete data. Int. Stat. Rev. 63, pp.215—232.
22. Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., and Teller, E. (1953) Equations of state calculations by fast computing machines, J. Chem. Phys., 21, 1087-1091.
23. Morten Frydenberg, Stefen L. Lauritzen, 1989. Decomposition of maximum likelihood in mixed graphical interaction models, Biometrika 76, pp.539—555.
24. Myra Spiliopoulou, “Web Usage Mining for Web Site Evaluation”, Commun. ACM 43(8), Aug. 2000, pp.127-134.
25. Paolo Giudici ., Gianluca Passerone, 2002. Data mining of association structures to model consumer behaviour, Computational Statistics & Data Analysis 38, pp.533—541.
26. Petros Dellaportas, Jonathan J. Forster, 1999. Markov chain Monte Carlo model determination for hierarchical and graphical log-linear models, Biometrika 86, pp.615—633.
27. R. Agrawal, and R. Srikant, “Fast Algorithms for Mining Association Rules,” Proc. ofthe 20th Int’l Conference on Very Large Databases, Santiago, Chile, Sept. 1994.
28. Tierney, L. (1994) Markov chains for exploring posterior distribution (with discussion),Annals of Statistics, 22, 1701-1762.
29. Xuemin Lin; Xiaomei Zhou; Yuh-Chi Lin, Efficiently Mining Tree Traversal Patterns in a Web Environment. TENCON 98. 1998 IEEE Region 10 International Conference on Global Connectivity in Energy, Computer, Communication and Control Volume: 1, 1998, pp.115—117.
30. Yi, J. and Sundaresan, N., 「Mining the Web for Acronyms Using the Duality of Patterns and Relations」,Proceedings of the Second International Workshop on Web Information and Data Management, pp.48-52, 1999.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top