本篇論文之主題是針對中文知識庫提出一套能做最佳部份吻合查詢的系統。所謂最佳 部份吻合查詢是根據某些對相似點的測度,從檔案中找到與給定目標最相近的項目。 本論文之系統包含兩大部份:知識庫的建立和演算法的發展。在知識庫建立的部份, 我們利用中文詞組的配合關係,將定義域裡具有相同端詞的項目歸為一類,並以端詞 為關鍵字,建立關鍵字表,俾益後續的搜尋工作。為了做相似點的測度,我們以「規 則評價樹」為基礎,其順序會影響測度值。我們並且用網狀關連組織來表示定義域裡 各個項目間的相關性。 在演算法的部份,先由關鍵字表找到給定目標所屬的類別,及該類別在知識庫中位址 的上、下限,然後經由「有序性規則評價樹」布林邏輯及權值指派,分別計算給定目 標與該區間裡各項目的相關值;相關值最大者為最佳部份吻合解。當相關值等於 1時 ,則為完全吻合解。
|