跳到主要內容

臺灣博碩士論文加值系統

(44.211.117.197) 您好!臺灣時間:2024/05/21 03:49
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:郭朝龍
研究生(外文):Chao-Lung Kuo
論文名稱:垃圾郵件過濾器之研究—以貝氏推論為基礎
論文名稱(外文):Research of Spam Filtering---the foundation of Bayes
指導教授:張文華張文華引用關係
口試委員:劉仲矩邱垂昱
口試日期:2005-06-17
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:工業工程與管理系所
學門:工程學門
學類:工業工程學類
論文種類:學術論文
論文出版年:2005
畢業學年度:93
語文別:中文
論文頁數:48
中文關鍵詞:電子郵件垃圾郵件簡單貝氏貝氏網過濾器
外文關鍵詞:e-mailspamNaïve BayesBayes Netfilter
相關次數:
  • 被引用被引用:1
  • 點閱點閱:420
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:4
隨著網際網路快速的蓬勃發展,電子郵件便成為現代人交流通訊不可或缺的工具,但也因此也成為不請自來的行銷郵件、病毒、惡意程式…等等的傳播媒介,對個人的電腦,甚至企業的電腦造成很大的威脅,而且有越演越烈的趨勢,所以如何處理電子郵件的安全問題是現今網際網路問題的重要課題之一。
本研究先就垃圾郵件的危害作分析,並提出現行垃圾郵件過濾的方法,最後採用貝氏推論中的天真貝氏分類法和貝氏網分類法來建構過濾器,希望可建構出比現在已知的貝氏分類法為基礎更好的過濾器。
With the fast development of Internet, e-mail has been becoming the most and fastest economical modern way for communication. But it begins to be the carrier of spam、virus or the malicious program, which seriously threaten the safety of the private and business computer system. So how to solve its security problem properly has become one of important topic.
First, it essay discusses the situation and the harm of spam and present spam-filter of spam. Finally, the uses Native Bayes and Bayes Net to establish spam filter and hope it can be better than the current Bayes used.
摘要 I
目錄 III
圖目錄 VI
表目錄 VII
第一章緒論 1
1.1 研究背景 1
1.2 研究動機 1
1.3 研究目的 2
1.4 研究流程 3
第二章文獻探討 4
2.1 電子郵件 4
2.1.1 電子郵件結構 4
2.1.2 電子郵件技術 5
2.1.3 電子郵件協議 6
2.1.3.1 SMTP協議 6
2.1.3.2 POP3協議 7
2.1.3.1 MIME協議 8
2.1.4 電子郵件過濾的類型 8
2.1.4.1 MAT過濾 9
2.1.4.1 MDA過濾 10
2.1.4.1 MUA過濾 10
2.2 垃圾郵件 11
2.2.1 垃圾郵件所引發的問題 11
2.3 分類法簡介 12
2.3.1 KNN分類法 13
2.3.2 決策樹分類法 13
2.3.3 支向機分類法 14
2.4 貝氏定理 16
2.4.1 貝氏推論 17
2.4.1.1 簡單貝氏分類 17
2.4.1.2 貝氏網 18
2.5 相關研究 19
2.6 文獻評析 20
第三章研究方法 21
3.1 垃圾郵件過濾器之架構 21
3.2 特徵字資料庫之架構 22
3.2.1 特徵字 23
3.2.2 特徵字提取 24
3.2.3 特徵字機率值 25
3.3 以貝氏理論為基礎的垃圾郵件過濾器 25
3.3.1 貝氏網分類法 26
3.3.2 貝氏郵件過濾器 27
第四章測式與評估 29
4.1測試前假設 29
4.2實際測試 31
4.3評估 40
4.3.1 特徵字數量評估 41
4.3.2 與其他貝氏推論比較 42
第五章結論與建議 44
5.1結論 44
5.2研究限制 44
5.3後續研究之建議 44
參考文獻 46
[1]Akaho Shotaro,(2002)” Conditionallyindependent component analysis for supervised feature extraction”, Neurocomputing vol.49 pp.139 – 150
[2]Androutsopoulos Ion, Georgios Paliouras, Vangelis Karkaletsis, Georgios Sakkis, Constantine D. Spyropoulos and Panagiotis Stamatopoulos,(2000)” Learning to Filter Spam E-Mail: A Comparison of a Naïve Bayesian and a Memory-Based Approach”
[3]Bevilacqua-Linn Michael,(2003)” Machine Learning for Naive Bayesian Spam Filter Tokenization”
[4]Chib Siddhartha, Federico Nardari, Neil Shephard,” Markov chain Monte Carlo methods for stochastic volatility models(2002)”, Journal of Econometrics vol.108 pp.281 – 316
[5]Dorp J. Rene Van, Thomas A. Mazzuchi,(2004)” A general Bayes exponential inference model for accelerated life testing”, Journal of Statistical Planning andInference vol.119 pp.55 – 74
[6]Karunamuni Rohana J., Shunpu Zhang,(2003)” Optimal linear Bayes and empirical Bayes estimation and prediction of the &nite population mean”, Journal of Statistical Planning and Inference vol.113 pp.505 – 525
[7]Madi Mohamed T., Thomas Leonard, Kam-Wah Tsui,(2000)”Bayes inference for treatment effects with uncertain order constraints”, Statistics & Probability Letters vol.49 pp.277 - 283
[8]MacNab Ying C.,(2003)” A Bayesian hierarchical model for accident and injury surveillance”, Accident Analysis and Prevention vol.35 pp.91 – 102
[9]Pulcini G.,(2000)” On the overhaul effect for repairable mechanical units: a Bayes approach”, Reliability Engineering and System Safety vol.70 pp.85–94
[10]Tretyakov Konstantin,(2004)” Machine Learning Techniques in Spam Filtering”, Data Mining Problem-oriented Seminar, MTAT.03.177 pp.60-79
[11]Androutsopoulos I. et al. (1999)“An Experimental Comparison of Na¨ıve Bayesian and Keyword-Based Anti-Spam Filtering with Personal E-mail Messages” http://www.aueb.gr/users/ion/publications.html
[12]Androutsopoulos I. et al. (2000)“Learning to Filter Spam E-Mail: A Comparison of a Naive Bayesian and a Memory-Based Approach”
http://www.aueb.gr/users/ion/publications.html
[13]Graham Paul. (2003)“A Plan for Spam”
http://paulgraham.com/spam.html
[14]Graham Paul (2003)”Better Bayesian Filtering”
http://paulgraham.com/better.html
[15]H Tsai, C. (1998)“MMSEG: A word identification system for Mandarin Chinese text based on two variants of the maximum matching algorithm” http://www.geocities.com/hao510/mmseg/
[16]Laur S.(2002) “Toenaosuste leidmine Bayes’i yorkudes”(2002)
http://www.egeen.ee/u/vilo/edu/2003-04/DM_seminar_2003_II/Raport/P08/main.pdf
[17]Newman M. B.(2003) “An Analytical Look at Spam”(2003)
http://www.vgmusic.com/~mike/an_analytical_look_at_spam.html
[18]張文華,垃圾郵件的規範管理研究,國立臺灣大學,商學研究所,博士論文,2000
[19]藍中賢,結合模糊集合理論與貝氏分類法之資料探勘技術-應用於健保局醫療費用審查作業,元智大學,資訊研究所,碩士論文,2000
[20]吳晏萱,最佳服務中心點數目及位置決策資訊系統,華梵大學,工業管理學系碩士班,碩士論文,2002
[21]吳文峰,中文郵件分類器之實作及分析,逢甲大學,資訊工程學系,碩士論文,2002
[22]高志強,組合自動化文件分類技術之研究-以專利文件分類為例,中原大學,資訊管理學系,碩士論文,2003
[23]王景南,多類支向機之研究,元智大學,資訊管理學系,碩士論文,2003
[24]雲健,基於qmail的郵件智能分析過濾繫統的設計與實現,內蒙古大學,計算機應用技術系,2003
[25]潘文鋒、王斌、潭松波,Winnow算法在垃圾郵件過濾中的應用,2004
[26]劉一賜,關鍵報告:電子郵件 垃圾?行銷?,網路通訊,2004,Jan,88 – 93
[27]徐鳳美,管管這些垃圾郵件吧!,網路通訊,2004,Feb,56 – 59
[28]高銘鍾,垃圾郵件面面觀,網路通訊,2004,Feb,60 – 61
[29]丘立全,追殺垃圾郵件追殺病毒,網路通訊,2004,Feb,62 – 64
[30]鄭志文,完全垃圾信阻絕法,網路通訊,2004,Apr,132 - 135
[31]阿丹,新電子郵件時代,網路通訊,2004,July,19 – 20
[32]中央警察大學資訊密碼暨建構實驗室,E-mail與垃圾郵件的因果,網路通訊,2004,July,25 – 29
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top