跳到主要內容

臺灣博碩士論文加值系統

(18.206.76.226) 您好!臺灣時間:2021/07/30 23:25
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳志充
研究生(外文):Chih-Chung Chen
論文名稱:採用支持向量機演算法於網頁內文分類之網路廣告服務系統
論文名稱(外文):An Internet Advertisement Service System for Context Classification Based on Support Vector Machine Algorithm
指導教授:廖鴻圖廖鴻圖引用關係郭明煌郭明煌引用關係
指導教授(外文):Hung-Tu LiaoMing-Huang Kuo
學位類別:碩士
校院名稱:世新大學
系所名稱:資訊管理學研究所(含碩專班)
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:101
中文關鍵詞:網路廣告文件分類支持向量機
外文關鍵詞:Internet AdvertisementText CategorizationSupport Vector Machine
相關次數:
  • 被引用被引用:0
  • 點閱點閱:119
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
  近年來網際網路蓬勃發展,網際網路成了新興的媒體,也開啟了網路廣告市場這項龐大的商機。為了提升網路廣告的點閱率,提供網路使用者個人化的廣告是最有效的方法。在本研究中,提出以網路使用者瀏覽之網頁內容,作為提供廣告的依據。期望以此概念設計出個人化的廣告服務系統。
  本研究乃採用文件分類作為技術核心,來進行廣告服務系統之實作研究。在分類器的選擇上,使用在文件自動分類應用上一直都有不錯表現的支持向量機,來進行網頁內容分類之處理。除此之外,在文件自動分類技術方面提出一個新的分類架構,可以另外定義出「其他類別」,以提高分類的效果及效率,同時也能因應網頁內容具豐富又多類別的特性。在分類效果評估方面,本研究透過Accuracy、Precision、Recall及F-measure四種不同的量測方式,對已經訓練好的分類器進行評估。根據實驗的結果顯示,本研究所提出的分類架構對網頁內容分類有不錯效果,能幫助廣告服務系統作為提供個人化網路廣告的依據。
  The pace of Internet develop starts getting faster and faster in recent years. Internet become a rising medium, it also create an all new market and business for Internet advertisement. For the purpose of increasing Internet advertisement click rate, provide personalization advertisement for Internet user is the most efficiency way. In this thesis, based on Internet user browsing the contents of web page, then the system will provide relative advertisement. Designing a personalization advertising system in this conecept is the goal of this research.
  The core technology of this thesis use document classification to implment advertising service. This thesis choice the algorithm of “Support Vector Machine” in automatic document categorization to analyze web page. Besides this thesis create new categorization architecture in automatic document categorization. Define “Others categorization” in entire architecture for increasing categorization efficiency. In the meantime, it could solve the complex and rich features in web page. Evaluate effection of categorization. This thesis using Accuracy, Precision, Recall and F-measure Four kinds of measurement methods to estimate. According to testing results, this study could provide extreme match advertisement depend on browsing page and it could assist advertising system to delivery accurately internet advertisement.
誌謝 I
摘要 II
Abstract III
目錄 IV
圖目錄 VI
表目錄 VIII
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機 3
1.3 研究目的 4
1.4 研究範圍 4
1.5 論文架構 4
第二章 文獻探討 5
2.1 網路廣告 5
2.1.1 網路廣告定義 5
2.1.2 網路廣告特性 6
2.1.3 網路廣告效果評估方式 11
2.1.4 網路廣告系統相關研究 12
2.1.5 網路廣告小結 18
2.2 文件分類 18
2.2.1 文件分類定義 20
2.2.2 文件分類應用 22
2.2.3 國外相關研究 23
2.2.4 國內相關研究 25
2.2.5 文件分類小結 29
第三章 相關理論與技術介紹 30
3.1 文件自動分類相關技術 30
3.1.1 斷詞處理 31
3.1.2 特徵挑選 33
3.1.3 向量空間模型 35
3.1.4 支持向量機 36
3.2 Ajax技術介紹 39
3.3 小結 44
第四章 自動化網頁分類網路廣告服務系統 45
4.1 系統相關參與者與負責工作 45
4.2 系統設計議題 49
4.3 系統流程 51
4.4 使用者端網頁溝通機制 52
4.4.1 使用非同步處理的廣告程式碼 53
4.4.2 網頁取得效能考量與解決方法 55
4.5 網頁分類處理機制 56
4.5.1 網頁分類議題 56
4.5.2 網頁分類架構 56
4.5.3 網頁分類流程 58
4.5.4 收集訓練資料 60
4.5.5 前置處理 61
4.5.6 特徵挑選 63
4.5.7 轉換向量空間表示式 65
4.5.8 SVM參數設定與訓練 67
4.6 系統架構 68
第五章 系統評估與展示 70
5.1 實驗環境、資料、評估方法與步驟 70
5.1.1 實驗環境 70
5.1.2 實驗資料 70
5.1.3 系統評估方法 71
5.1.4 實驗步驟 72
5.2 實驗結果與分析 72
5.2.1 使用多元分類器進行分類實驗 73
5.2.2 使用二元分類器進行分類實驗 73
5.2.3 使用本研究系統進行分類實驗 74
5.2.4 使用多元+分類器進行分類實驗 75
5.2.5 綜合評估比較 75
5.3 系統開發環境 80
5.4 系統展示 80
5.5 小結 83
第六章 結論與未來研究建議 85
6.1 結論 85
6.2 未來研究 87
參考文獻 89
[1]丁一賢,「運用網頁探勘為基礎的個人化技術於網路廣告之探討」,彰化師範大學資訊管理學系碩士論文,2002年。
[2]中央研究院,「中文斷詞系統」,http://www.sinica.edu.tw/,2009年。
[3]王紹睿,「具線上學習之擷取系統和其自動維護機制,中央大學資訊工程學系碩士論文,2007年。
[4]王聖中,「語法式中文斷詞之研究」,淡江大學資訊工程學系碩士論文,1994年。
[5]台北市網際網路廣告暨媒體經營協會,「台北市網際網路廣告暨媒體協會統計2008年台灣整體網路廣告市場規模」,http://www.iama.org.tw/,2009年。
[6]白中光,「互動式網路廣告播放系統建置之研究」,東吳大學資訊科學學系碩士論文,2004年。
[7]李明德,「網路廣告輪播系統之開發」,中央大學機械工程學系碩士論文,2000年。
[8]易觀國際網路資訊諮詢有限公司,「中國互聯網廣告市場年度綜合報告2009」,http://www.analysys.com.cn/,2009年。
[9]林昕潔,「以SVM與詮釋資料設計書籍分類系統」,交通大學資訊科學與工程學系碩士論文,2006年。
[10]范長康、蔡文祥,「以鬆弛法作中文斷詞」,全國計算機會議論文集,423-431頁,1987年。
[11]高橋登史朗,「Ajax與Google Map API入門實作」,博碩文化股份有限公司,2006年。
[12]陳廷忠,「一個以多重類別架構為主的多國語言文件分類技術之開發研究」,高雄應用科技大學電機工程學系碩士論文,2006年。
[13]陳俊男,「浮水印廣告呈現方式對廣告效果與抱怨強度之影響」,東吳大學資訊科學學系碩士論文,2006年。
[14]雅虎資訊,「Yahoo!奇摩新聞」,http://tw.yahoo.com/,2009年。
[15]廖哲輝,「具有使用者資訊之網際網路廣告技術」,南華大學資訊管理學系碩士論文,2006年。
[16]鄭旭峰,「運用資料挖掘技術於個人化網路廣告系統之建置」,逢甲大學企業管理學系碩士論文,2001年。
[17]鄭為倫,「單分類器在文件多類別分類上之研究」,銘傳大學資訊管理學系碩士論文,2005年。
[18]�顝y旻,「使用網路服務技術建立網路廣告資訊系統架構」,南華大學資訊管理學系碩士論文,2008年。
[19]comScore, “comScore Media Metrix Ranks Top 50 U.S. Web Properties for October 2008”, http://www.comscore.com/, 2008.
[20]Cortes, C. and Vapnik, V., “Support Vector Networks,” Machine Learning, Vol. 20, No. 3, pp. 273-297, 1995.
[21]Dentsu, “Dentsu's Advertising Expenditures in Japan”, http://www.dentsu.com/, 2009.
[22]Dumais, S. T., Platt, J., Heckerman, D., and Sahami, M., “Inductive Learning Algorithms and Representations for Text Categorization,” Proceedings of the 7th International Conference on Information and Knowledge Management, pp. 148-155, 1998.
[23]Hawkins, D. T., “Electronic Advertising on Online Information Systems,” Online, Vol. 18, No. 2, pp. 26-39, March 1994.
[24]Hearst, M.A., “Untangling Text Data Mining,” Proceedings of the 37th Annual Meeting of the Association for Computational Linguistic, pp. 3-10, 1999.
[25]Hoffman, D. L., and Novak, T. P., and Chatterjee, P., “Commercial Scenarious for the Web:Opportunities and Challenges,”Project 2000: Research Program on Marketing in Computer-Metriced Environments, 1996.
[26]Interactive Advertising Bureau and PricewaterhouseCoopers, “Q3 '08 Internet Advertising Revenue Press Release”, http://www.iab.net/, 2008.
[27]Joachims, T., “Learning to Classify Text Using Support Vector Machines,” Kluwer Academic, 2002.
[28]Joachims, T., “Text Categorization with Support Vector Machines: Learning with Many Relevant Features,” Proceedings 10th European Conference on Machine Learning, pp. 137-142, 1998.
[29]Lewis, D. D., “Reuters-21578 Text Categorization Test Collection Distribution”, http://www.daviddlewis.com/, 1996.
[30]Li, H., and Yamanishi, K., “Text Classification Using ESC-based Stochastic Decision Lists,” Information Processing and Management, Vol. 38, No. 3, pp 343-361, May 2002.
[31]Manning, C. D. and Schuetze, H., “Foundations of Statistical Natural Language Processing,” MIT Press, 1999.
[32]Maron, M. E., “Automatic Indexing: an Experimental Inquiry,” Journal of the ACM, Vol. 8, No. 3, pp. 404-417, 1961.
[33]Nic, J. Y. and Briscobois, M., “On Chinese Text Retrieval,” Proceeding of SIGIR, pp. 225-233, 1996.
[34]Riordan, R. M., “Head First Ajax,” Oreilly Media, 2008.
[35]Salton, G., Wong, A., and Yang, C. S., “A Vector Space Model for Automatic Indexing,” Communications of the ACM, Vol. 18, No. 11, pp. 613-620, 1975.
[36]Schlosser, A., Shavitt, S., and Kanfer, A., “Survey of Internet User's Attitudes Toward Advertising,” Journal of Interactive Marketing, Vol. 13, No. 3, pp. 34-53, 1999.
[37]Sebastiani, F., “Machine Learning in Automated Text Categorization,” ACM Computing Surveys, Vol. 34, No. 1, pp. 1-47, 2002.
[38]Sproat, R., and Shih, C., “A Statistical Method for Finding Word Boundaries in Chinese Text,” Computer Processing of Chinese and Oriental Languages, Vol. 4, No. 4, pp. 336-351, 1990.
[39]Web Track Survey, “First Web Advertising Placement Study Debuts,” Business
Information Review, Vol. 36, No. 6, pp. 100-102, 1996.
[40]Yang, Y., and Liu, X., “A Re-examination of Text Categorization Methods,” Proceedings of the 22nd International Conference on Research and Development in Information Retrieval, pp. 42-49, 1999.
[41]Yeh, C. L., and Lee H. J., “Rule-Based Word Identification for Mandarin Chinese Sentences-A Unification Approach,” Computer Processing of Chinese and Oriental Languages, Vol. 5, No. 2, pp. 97-118, 1991.
[42]Zeff, R., and Aronson, B., “Advertising on the Internet,” John Wiley and Sons, 1997.
電子全文 電子全文(本篇電子全文限研究生所屬學校校內系統及IP範圍內開放)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊