(3.231.230.175) 您好!臺灣時間:2021/04/16 02:31
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:鄒昇衛
研究生(外文):Sheng-wei Tsou
論文名稱:應用領域本體論設計整合網路上搜尋引擎機制
論文名稱(外文):Design of an Integrated Mechanism of Search Engines on Web by Domain Ontology
指導教授:王昌斌王昌斌引用關係
指導教授(外文):Chin-bin Wang
學位類別:碩士
校院名稱:南華大學
系所名稱:資訊管理學研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:74
中文關鍵詞:資訊檢索網頁內容探勘本體論搜尋引擎
外文關鍵詞:ontologyinformation retrievalweb content miningsearch engine
相關次數:
  • 被引用被引用:11
  • 點閱點閱:438
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:69
  • 收藏至我的研究室書目清單書目收藏:2
  近來由於產業及科技的競爭,以致於相關知識的蒐集、獲取、整合、儲存、管理、分享與運用之重要性相對提升。隨著網際網路發展,如何以自動化的方式有效獲取網路上的資訊提供使用者所需的知識是一項很大的挑戰。
 
  本研究結合利用資料探勘發掘網頁內容知識並檢視其相似性且導入領域實體概念,發展強化搜尋引擎的過濾及排序機制,透過演算法去除格式不完整、有重覆性網址且針對格式化的摘要及標題進行資訊含量之運算,其值若介於本研究所設立之可接受範圍,便進一步計算摘要權重值;若遇到描述不同但意思相仿的摘要,會應用領域實體所建立的法則計算詞彙相似程度,其後給予適當權重值,本研究的領域實體是著重於國小數學學習方面,系統則將每篇摘要之權重排列順序,其後檢視符合原意與否,再取回其網頁內容,經由擷取就變成可利用知識,此知識可提供給使用者解決問題之參考。希冀能節省使用者自行過濾檢索時間與減少頻寬資訊量。
  Due to the rapid development of information technology, it is important to search, gain, integrate, store, share, reuse and manage the different scopes of professional knowledge. This issue becomes increasingly essential for users to extract the appropriate internet information efficiently and automatically for a great variety of resources on websites.
 
  The research includes both web content mining and information retrieval to design a strengthened mechanism of search engines on web by domain ontology. We try to develop and design the algorithms which have the functions of filtering, ranking and weighting. The purpose is to filter the dump link and the advertisement link according to the web document titles, the ranking of the abstract’s URL and the weighting of the information content. Then the users can retrieve more suitable information and capture the web content knowledge efficiently. In the process of filtering and ranking, the knowledge can be refined to useful one which can offer end users to decide whether or not the knowledge meets their demands. In this way, the users can save the time to filter and retrieve and decrease the loading of internet.
書名頁 ii
論文口試合格證明 vi
誌謝 vii
中文摘要 viii
英文摘要 x
目錄 xii
表目錄 xiv
圖目錄 xv
 
第一章 緒論 1
第一節 研究背景 1
第二節 研究動機 2
第三節 研究目的 3
第四節 研究流程 4
第五節 論文架構 7
 
第二章 文獻探討 8
第一節 網頁內容探勘 8
第二節 搜尋引擎 9
壹、AltaVista 11
貳、GAIS 12
參、Google 14
肆、Yahoo 16
第三節 資訊檢索 19
第四節 網路文件自動摘要 20
壹、相似度 22
第五節 實體論 23
 
第三章 網路整合型搜尋引擎機制架構 28
第一節 前處理機制 28
第二節 整合型搜尋引擎機制 31
第三節 後處理機制 32
壹、格式標準化機制 33
貳、過濾與排序機制 33
參、比對演算法 34
肆、排序演算法 39
伍、網頁擷取機制 49
 
第四章 系統開發與實作 50
第一節 實驗環境介紹 50
第二節 資料來源與限制 51
第三節 實驗結果 56
 
第五章 結論與未來展望 70
第一節 結論 70
第二節 未來展望 71
 
參考文獻 72
中文部份
 
[1]王志浩,「知識發掘之技術於智慧型資訊檢索系統之研究」,元智大學資訊工程研究所碩士論文,92年7月。
 
[2]王常威,「以內容為基礎之XML文件分類方法之研究」,成功大學資訊管理研究所碩士論文,93年6月。
 
[3]陳光華、莊雅蓁,「應用於資訊檢索的中文同義詞之建構」,中國圖書館學會會報,第六十七期,93∼107頁,90年。
 
[4]石逸民,「從全球資訊網擷取同義詞」,中正大學資訊工程研究所碩士論文,92年7月。
 
[5]李健興、陳雅絹、郭雅琪及莊宏翊,「基於Ontology之中文文件自動摘要技術之研究」,輔仁管理評論,92年。
 
[6]邱立豐,「互動式概念查詢應用於網路文件自動摘要之效益」,雲林科技大學資訊管理研究所碩士論文,91年6月。
 
[7]林欣彥,「權重式超搜尋引擎與網頁偵測之研究」,朝陽科技大學資訊管理研究所碩士論文,92年7月。
 
[8]柯淑津,“從詞網出發的中文複名詞的語意表達”,International Journal of Computational Linguistics and Chinese Language Processing, pp. 93-108, 2003.
 
[9]陳同孝、謝俊宏及張家力,“智慧型網際代理人系統之建構”,台灣區網際網路研討會TANET,89年。
 
[10]陳鍾誠、廖先志,「OpenPDF-將PDF轉為XML的開放原始碼軟體」,94年10月。
 
[11]陳麴合,「超連結與關鍵字頻分析之搜尋引擎研究」,屏東科技大學資訊管理研究所碩士論文,90年6月。
 
[12]許志新,「分散式搜尋引擎之設計與實作」,中正大學資訊工程研究所碩士論文,85年6月。
 
[13]黃純敏、吳郁瑩,“網路中文文件自動摘要”,台灣區網際網路研討會TANET,88年。
 
[14]黃純敏、楊存一及邱立豐,「多語文超文件自動摘要與評估」,行政院國家科學委員會專題研究計畫成果報告,計劃編號:NSC89-2416-H-224-053,90年。
 
[15]謝文泰、陳文鋕、張履平,「以句子資訊量來產生文件摘要之模式」,第七屆人工智慧與應用研討會,661∼666頁,91年11月。
 
[16]鍾明強,「基於Ontology架構之文件分類網路服務研究與建構」,成功大學資訊工程研究所碩士論文,93年6月。
 
[17]蕭榮賢,「基於詞彙分析之資訊搜尋系統的設計與實作」,中正大學電機工程研究所碩士論文,94年7月。
 
二、西文部份
 
[18]R. Cooley, B. Mobasher, and J. Srivastava, "Web mining:information and pattern discovery on the World Wide Web," 9th IEEE International Conference on Tools with Artificial Intelligence, pp. 558-567, 1997.
 
[19]T. R. Gruber, "A translation approach to portable ontology specifications," Knowledge Acquisition, pp. 199-220, 1993.
 
[20]J. Han and K. Chang, "Data Mining for Web Intelligence," IEEE Computer, pp. 64-70, 2002.
 
[21]C. Jenkins, M. Kackson, P. Burden, and J. Wallis, "Searching the world wide web:an evaluation of available tools and methodologies," ELSEVIER Journal on Information and software technology, pp. 985-994, 1998.
 
[22]A. Maedche, B. Motik, L. Stojanovic, and R. Studer, "Ontologies for Enterprise Knowledge Management," IEEE Intelligent System, pp. 26-33, 2003.
 
[23]Sunil Kr. Pandey and R.B. Mishra, "Intelligent Web Mining Model to Enhance Knowledge Discovery on the Web," Seventh International Conference on Parallel and Distributed Computing Applications and Technologies, pp. 339-343, 2006.
 
[24]E. Spertusm, "Mining Structural Information on the Web," The Sixth International World Wide Web Conference, pp. 1205-1215, 1997.
 
三、網站部份
 
[25]資訊檢索與知識探勘, http://www.lac.org.tw/20040518/93_teacher_03.doc
 
[26]搜尋引擎排名, http://www.promote168.com.tw/search-engine-list.htm
 
[27]國教專業社群網, http://teach.eje.edu.tw/
 
[28]AltaVista, http://www.altavista.com/
 
[29]GAIS, http://gais.cs.ccu.edu.tw/
 
[30]Google, http://www.google.com.tw/
 
[31]W3C web site, http://www.w3.org/XML
 
[32]Yahoo, http://tw.yahoo.com/
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔