跳到主要內容

臺灣博碩士論文加值系統

(44.220.247.152) 您好!臺灣時間:2024/09/20 19:50
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:楊良吉
研究生(外文):Liang-chi Yang
論文名稱:全球資訊網過濾軟體之研究
論文名稱(外文):A Study on Log-Based Web Access Filtering
指導教授:歐陽彥正歐陽彥正引用關係
指導教授(外文):Yen-jeng Oyang
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊工程學研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2001
畢業學年度:89
語文別:中文
論文頁數:53
中文關鍵詞:過濾色情伺服端以紀錄為基礎的
外文關鍵詞:filterpornserver-sidelog-based
相關次數:
  • 被引用被引用:8
  • 點閱點閱:344
  • 評分評分:
  • 下載下載:24
  • 收藏至我的研究室書目清單書目收藏:0
本論文提出一個過濾網際網路存取的機制,而本論文所提出的過濾機制是利用分析伺服器的存取紀錄以確認含有不當成分的網站。這個過濾軟體可以阻隔所有由存取紀錄分析得來的網站黑名單中的任何網站。這個機制的主要優點是其做法不因內容本身格式而異;而另一方面,傳統的以內容為基礎(content-based)的過濾機制需要不同的演算法來處理不同格式的內容。舉例來說,以內容為基礎的演算法對於過濾文字題材或影像題材即需要不同的演算法來處理。而本論文所提出機制的另外一個優點是,它可被運用範圍不因題材性質而異。舉例來說,以內容為基礎的演算法,對於過濾包含色情或暴力的影像需要不同的演算法來個別處理。而本論文也同時探討所提出的這個機制如何併入系統使用以及所需增加的負載。
The thesis proposes a filtering mechanism for internet accesses. The proposed filtering mechanism is based on mining access logs to identify the web sites that contain improper contents. The filtering software then blocks all the accesses to the web sites in the black list that is derived from mining access logs. The main advantage of the proposed mechanism is that it can be generally applied regardless of formats of contents. On the other hand, the conventional content-based filtering mechanism requires different algorithms for handling different formats of content. For example, with the content-based approach, different algorithms must be developed for filtering text materials and image materials. Another advantage of the proposed mechanism is that it can be applied regardless of the nature of contents. For example, it can be applied to filter web sites that contain violent materials and sexual materials. On the other hand, with the content-based approach, different algorithms must be developed for filtering images that contain violent materials and sexual materials. This thesis also discusses how the proposed mechanism can be incorporated in the system and the overhead induced.
第 1 章 序論1
1.1 網路資訊生活時代1
1.2 網路色情資訊的氾濫2
1.2.1 網路色情氾濫情況:3
1.2.2 網路色情對社會的影響5
1.2.3 使用過濾軟體5
1.3 過濾軟體(filter software)的應用6
1.4 我們提出的解決方法6
1.5 方法好壞的比較7
1.6 本論文的獲致的結論8
1.7 論文組織與其他章節的內容8
第 2 章 相關研究9
2.1 PICS(Platform for Internet Content Selection)9
2.2 過濾的方法10
2.2.1 過濾軟體種類10
2.2.2 傳統過濾網路色情的方式與問題11
2.2.3 過濾軟體的架構13
2.3 資料挖掘(data mining)15
2.3.1 Web Log Mining:15
2.3.2 Clustering(資料分群):16
2.4 Proxy server:18
2.4.1 代理伺服器所扮演角色18
2.4.2 代理伺服器架構:20
2.4.3 Squid21
2.4.4 proxy log的格式22
第 3 章 過濾機制的問題定義及演算法24
3.1 資訊過濾(information filtering)的模型24
3.2 log的抽象定義及trec25
3.3 問題定義--如何利用log-based approach做資訊過濾26
3.3.1 確定欲過濾主題26
3.3.2 Log資料對時間的變化度26
3.3.3 Trec的特性27
3.3.4 各種Trec和欲過濾主題:27
3.3.5 判斷Transaction和Filter主題是否有關:27
3.4 解決方法 — Data Mining from Proxy Logs, Generate the Black List.28
3.5 方法的定性分析,與其他方法的定性比較29
3.6 演算法30
3.7 複雜度分析31
第 4 章 實驗33
4.1 proxy log數據分析:33
4.2 資料準備(training set and testing set)34
4.3 實驗環境與實驗結果的評估方式36
4.3.1 實驗環境37
4.3.2 是否為色情網址的人工檢查原則37
4.4 系統架構:38
4.4.1 製造黑名單(MakeBlackList)38
4.5 實驗數據:41
4.5.1 數據說明:42
4.6 實驗的結果:43
4.7 實驗中的觀察與討論:44
4.7.1 網站變化快速,所以採用log-based較符合需求44
4.7.2 使用者行為相似的原因45
4.7.3 藉由較明顯的行為的統計,用來加以過濾不明顯的行為45
第 5 章 系統設計46
5.1 設計一個可用及時過濾系統:46
5.2 與proxy的配合方式:47
5.3 模擬結果:48
第 6 章 結論與展望49
6.1 本論文目的49
6.2 本論文所達到效果49
6.3 本論文所提方法的問題50
6.4 可以進一步改進的方法51
文獻回顧 ……………………………………………………………………52
文獻回顧:
[1]高玉泉,色情網路解決之道,http://www.crime.org.tw/about-b_05.html
[2]張弘旻,網路影響親子間的溝通,http://www.crime.org.tw/about-b_04.html
[3]巫慶珠(2000),http://www.noporn.com.tw/News/News007.htm
[4]A briefing on public policy issues affecting civil liberties online(1996) , http://www.cdt.org/publications/pp_2.5.html
[5]A. K. Jain, M. N. Murty, and P. J. Flynn. Data clustering: a review. ACM Computing Surveys, 31(3):264-- 323, 1999.
[6]D. A. Forsyth and M. M. Fleck, Automatic Detection of Human Nudes, Internation Journal of Computer Vision 32(1), 63-77(1999)
[7]D. A. Forsyth and M. M. Fleck (1996) Identifying nude pictures, IEEE Workshop on the Applications of Computer Vision(1996)
[8]Karen G. Schneider(1998) , Shining A Light on Filters in Libraries Special Senate Briefing Version , http://www.bluehighways.com/filters/senate/
[9]D. Burt , Uncovering Internet Pornography in America''s Library, DANGEROUS ACCESS(2000)
[10]M. M. Fleck, D. A. Forsyth, and Chris Bregler , Finding Naked People, European Conference on Computer Vision(1996)
[11]PICS,http://www.w3.org/PICS/
[12]PeaceFire,http://www.peacefire.com
[13]Rimm(1995), maketing pornography on information high way, http://trfn.pgh.pa.us/guest/mrtext.html
[14]Spinning the World-Wide Web, http://www-sld.slac.stanford.edu/sldwww/beamline/history.html
[15]Squid''s FAQ, http://www.squid-cache.org/Doc/FAQ/FAQ.html
[16]T. Kurita, An Efficient Agglomerative clustering Algorithm using a Heap, Pattern Recognition, Vol.24, No.3, pp.205-209, 1990
[17]Zip''s law, http://linkage.rockefeller.edu/wli/zipf/
[18]K. P. Joshi, A. Joshi, Y. Yesha and R. Krishnapuram,Warehousing and Mining Web Logs, ACM(1999)
[19]V. N. Padmanabhan and L. Qiuand, The Content and Access Dynamics of a Busy Web Site: Findings and Implications, ACM(2000)
[20]W. Jicheng, H. Yuan, W. Gangshan, Z. Fuyan,Web Mining : Knowledge Discovery on the Web, IEEE(1999)
[21]P. Resnick and J. Miller, PICS: Internet Access Control Without Censorship, Communication of ACM(1996)
[22]P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J. Riedl, GroupLens: An Open Architecture for Collaborative Filtering of Netnews, ACM(1994)
[23]V. N. Gudivada and V. V. Raghavan, Content-Based Image Retrieval Systems, IEEE(1995)
[24]T. K. Shih, C. Wang, A. Y. Chang and C. Kao, Indexing and Retrival Scheme of the Image Database Based on Color and Spatial Relations, IEEE(2000)
[25]Information Filtering Resources, http://www.ee.umd.edu/medlab/filter/
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top