論文名稱(外文):A Self-Adaptive Approach to Fuzzy-Go Search Engine
外文關鍵詞:Fuzzy SearchSelf-AdaptiveGenetic AlgorithmOntology
一般的網際網路搜尋引擎大多是藉由輸入關鍵詞的方式來進行查詢,搜尋引擎不會自動找出與關鍵詞同義或意義相近的關鍵詞網頁,也無法區分每個關鍵詞不同的重要性,而且一字多義的問題常會造成搜尋結果出現大量不符合的網頁。為改善這些問題,Fuzzy-Go模糊搜尋引擎應用模糊理論與語意搜尋技術,建構Fuzzy Ontology以提供較適當的語意距離來進行關鍵詞的語意搜尋,並針對所有收錄網頁加以領域分類和找出關鍵詞及特徵值,最後整合考量每個網頁的關鍵詞相關程度、關鍵詞重要性、領域相關程度、和多個特徵值後,透過模糊聚合運算得出一個整體考量的網頁排序。本論文進一步使用基因演算法提供自適應調整機制,記錄Fuzzy-Go模糊搜尋引擎每次使用者搜尋後所點選的網頁與排序結果之差異,以不斷學習的方式來調整Fuzzy Ontology的組織架構、網頁的所屬領域分類、以及各個特徵值重要性的權重,透過自適應的調整機制來持續改善模糊搜尋引擎的內部設定及搜尋排序結果。
The Fuzzy-Go search engine develops a fuzzy ontology to capture the similarities of terms in the ontology for accomplishing the semantic search of keywords, a web crawler to gather and classify web pages, and a fuzzy search mechanism to aggregate all fuzzy factors based on their degrees of importance and degrees of satisfaction. In this paper, we apply the genetic algorithm to propose a self-adaptation approach to Fuzzy-Go search engine. For each search, the fuzzy search engine records the difference between the ordering of search results and user’s real behavior on clicking web pages. The feedbacks are gathered and analyzed to adjust the fuzzy similarities between terms in the fuzzy ontology, the domain classification of web pages, and the importance degrees of fuzzy factors. The ordering of search results can thus be improved gradually by continuous learning and adaptation.
中文摘要 I
Abstract II
致謝 III
目錄 IV
圖目錄 VI
表目錄 VIII
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
1.3 論文架構 4
第二章 相關研究與文獻 5
2.1 使用者回饋 5
2.2 語意相關度 6
2.3 自適應機制 8
第三章 模糊搜尋引擎 12
3.1 Fuzzy Ontology 12
3.2 Web Crawler 14
3.3 模糊搜尋機制 15
第四章 自適應調整機制 18
4.1 自適應調整特徵值重要性之權重 18
4.1.1 基因演算法 19
4.1.2 自適應調整特徵值重要性權重的流程 23
4.1.3 基因演算法於自適應調整特徵值重要性權重 24
4.2 自適應調整Fuzzy Ontology之組織架構 33
4.3 自適應調整網頁所屬領域 41
第五章 實驗結果與討論 50
第六章 結論與未來工作 60
6.1 結論 60
6.2 未來工作 61
圖3-1 模糊搜尋引擎的系統架構 12
圖3-2 兩階層式的Fuzzy Ontology 13
圖3-3 第二階層Term Lattice範例 14
圖3-4 重要程度的Linguistic Degree 16
圖3-5 關鍵詞密度有效性的歸屬函數 17
圖3-6 Term Extension Mechanism 17
圖4-1 基因演算法流程圖 21
圖4-2 多個特徵值因子重要性的自適應調整 23
圖4-3 針對單次搜尋,個體x與個體i的各自排序結果 26
圖4-4 輪盤選擇法示意圖 28
圖4-5 本研究之GA流程示意圖 29
圖4-6 Whole Arithmetic Crossover範例圖 31
圖4-7 高斯分佈 32
圖4-8 高斯突變範例圖 33
圖4-9 找出與輸入關鍵字相關的term 35
圖4-10 針對Fuzzy Ontology組織架構的自適應功能 36
圖4-11 S型函數 39
圖4-12 Z型函數 40
圖4-13 Domain Ontology示意範例圖 43
圖4-14 自適應調整網頁所屬領域範例 48
圖4-15 自適應調整網頁所屬領域範例(2) 49
圖5-1 使用者操作介面 50
圖5-2 使用者操作介面(2) 51
圖5-3 網頁搜尋結果 52
圖5-4 自適應調整特徵值權重之變化(一) 53
圖5-5 於第25世代的搜尋結果中,排序前十名網頁之點擊次數比例 55
圖5-6 於第125世代的搜尋結果中,排序前十名網頁之點擊次數比例 56
表4-1 個體與其適應值 28
