跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.88) 您好!臺灣時間:2026/02/15 08:56
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:黃鉥棚
研究生(外文):Shu-Peng Huang
論文名稱:以色情單字區域性特徵為基礎之中文色情網站過濾系統
論文名稱(外文):A Pornographic Websites Filtering System by Using Erotic Character's Regional Characteristic
指導教授:董呈煌董呈煌引用關係
指導教授(外文):Cheng-Huang Dong
學位類別:碩士
校院名稱:國立屏東商業技術學院
系所名稱:資訊管理系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2004
畢業學年度:92
語文別:中文
論文頁數:56
中文關鍵詞:文字區域特性色情網頁網際網路內容過濾
外文關鍵詞:PornText CategorizationInternetContent Filtering
相關次數:
  • 被引用被引用:0
  • 點閱點閱:1160
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:3
現今的網際網路中充斥著許多的色情資訊,而如何保護青少年及兒童不要被網路上不當的色情資訊所影響,便成了當前社會的重要議題。本論文提出一個色情網頁過濾系統,可以過濾具色情字成份的中文簡繁體字網頁。此系統共有四個模組,包含網頁文字分析核心,以及三個子系統功能。在色情網頁過濾系統的文字分析核心部分,本研究提出了利用文字出現在網頁中的比例特徵及集中程度,來辨認色情網站的演算法。而子系統部分,本研究則是以微軟作業系統為平台,建立了以下三個子系統:1.接收網路封包及網頁資料,2.監視作業系統中使用網路之程序,3.過濾系統保護,並說明其中所使用的技術知識及運作過程。最後實驗的結果顯示,本系統可正確的運作在微軟作業系統平台上,並具優秀的中文色情網頁過濾能力。
With the popularity of Internet, every one can easily get almost any kind of information from it. Of course, pornography information is included. How to protect children and teenagers from the negative effects of the Internet, become the important topic that most parents cared about. This dissertation presents a pornographic websites filtering system, is used for filtering the Chinese simplified character and traditional character webpage that have pornographic contents. This system include four modules: (1) Character analysis of the webpage; (2) Network data receiving; (3) Monitoring use network procedure; (4) System protect. In module of characters analysis of the webpage, this paper is to offer an algorithm which identifies the characters of existing words’ ratio and concentrative level comprised in the web pages, precisely and promptly screening web pages in favor of the recognition of pornographic websites. And the other modules, we will explain that the relevant technology and knowledge, and describe the operation process. The result shows that, this system works stably in Microsoft Operation System, and highly reliable on the discernment of pornographic websites.
中文摘要 I
英文摘要 II
目錄 III
表目錄 V
圖目錄 VI
1.緒論 1
1.1 研究動機及目地 1
1.2 論文結構 3
2.背景知識與相關理論 4
2.1 網頁資料截取與網路通訊監視之技術探討 4
2.1.1 微軟視窗系統網路架構簡介 5
2.1.2 核心協定驅動層 6
2.1.3 網路API 8
2.1.4 應用程式內部 9
2.1.5 程序與網路通訊監視技術 11
2.2 漢字編碼自動識別技術探討 13
2.2.1 常用漢字編碼介紹 13
2.2.2 漢字編碼自動識別演算法介紹 15
2.3 中文字詞為主文件分類技術 16
2.4 軟體運作保護技術探討 17
2.4.1 軟體運作保護基本知識 17
2.4.2 軟體運作保護技術 19
3.網頁單字區域性特徵分析研究 23
3.1 色情網頁文字區域性特徵 23
3.2 網頁文字特徵擷取方法 24
3.2.1 分析步驟 24
3.2.2 演算法 27
3.3 網頁辨認方法 27
3.3.1 分析步驟 28
3.3.2 演算法 33
4.系統建置 34
4.1 系統設計架構 34
4.1.1 封包及網頁資料截取模組 35
4.1.2 資料分析模組 37
4.1.3 網路應用程式監視及管理模組 39
4.1.4 系統保護模組 41
4.2 運作流程 44
5.實驗 47
5.1 實驗資料 47
5.2 實驗設計 48
5.3 實驗結果分析 49
6.結論與未來研究方向 54
參考文獻 55
[1]于明儉(2004),「GB vs BIG5 File Recognition」, http://ftp.cityu.edu.hk/ pub/chinese/ifcss/data/chrecog.gb.html
[2]王稔志(2001) ,「適應性的新聞分類系統」,未出版之碩士論文,國立清華大學資訊工程學系。
[3]行政院主計處(2004),「中文碼介紹」, http://www.cns11643.gov.tw/web/ word.jsp
[4]邱忠俊(1999),「犯罪語言學與資料檢索應用觀念之研究-以網際網路情色文學為例」,未出版之碩士論文,中央警察大學資訊管理研究所。
[5]李傳剛、鄭波(2003),「WDM驅動程式模型概論」,http://www.cww.net.cn/Technique/Article.asp?id=4004
[6]杜海倫(1999),「以標題進行新聞自動分類」,未出版之碩士論文,國立清華大學資訊工程研究所。
[7]林佩樺(2002),「在顧客導向之智慧型客戶接觸中心的架構下以文件分類的技術探索」,未出版之碩士論文,朝陽科技大學資訊管理系碩士班。
[8]林曾祥(1999),「犯罪語言學與資料檢索應用觀念之研究-以網際網路情色文學為例」,未出版之碩士論文,中央警察大學資訊管理研究所。
[9]許雅芬(2001),「新聞文件自動分類之研究」,未出版之碩士論文,東吳大學資訊科學系。
[10]許明陽(2002), 「利用API攔截電腦病毒」, 未出版之碩士論文, 逢甲大學資訊工程研究所碩士論文。
[11]國家圖書館(2003),「抵擋網路色情」,http://infotrip.ncl.edu.tw/law/ antisex.html
[12]葉宏達(2003),「未成年人上網接觸不當資訊之防治策略探討」,http://www.nhltc.edu. tw/~honda/antisex/homepage.htm
[13]董呈煌、黃鉥棚、林威男(2003) ,「深入探討微軟Windows 9x及NT系統之網路驅動程式運作架構的差異」,屏東商業技術學院「2003年資訊技術應用與發展研討會」
[14]維文編碼標準化資訊(2004),「GB編碼」, http://www.uighurlinux.org/ gbcode.htm
[15]蕭景燈(2003),「網站內容分級之發展概況」,http://stlc.iii.org.tw/ seminar/19980415/ index.htm
[16]David A. Solomon, Mark E. Russinovich (2000) , Inside Microsoft Windows 2000, Third Edition, Microsoft Press, Chapter13
[17]Frakes (1992), W.B&R.Baezay, Information Retrieval: Data Structures and Algorithms, Prentice-Hall.
[18]Ilsy(2003),「再談進程與埠的映射」, http://www.enwww.net/vcdoc/ portmap.htm
[19]Jock’s Studio (2004),「漢字編碼標準與識別」, http://jock.nease.net/java/ hzencode4.htm
[20]Lawrence Berkeley Laboratory, WINPCAP source code 2/8/2003.
[21]MSDN (2004), http://msdn.microsoft.com/library/default.asp?url=/library /en-us/winsock/winsock/tcp_ip_raw_sockets_2.asp
[22]Salton (1988), G.&C.Buckley, "Term Weighting Approaches in Automatic Information Retrieval", Journal of Information Processding and Management, Vol.24:3, pp.513-524.
[23]Scott Roberts (1999), Programming Microsoft Internet Explorer5, Microsoft Press, Chapter 6
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top