由於網際網路相關技術的成熟以及全球資訊網逐漸的普及化,代表傳遞資 訊單位的首頁文件在數量上呈現指數型態的快速增加,如何協助使用者找 尋需要的首頁文件成為搜尋引擎相關軟體系統努力的目標。由於資訊分散 的關係,可能一個搜尋引擎並無法收集足夠的文件以滿足使用者全部的需 求,而在服務效能上也常受到主機及網路負載的影響而呈現不穩定狀態, 因此我們提出一個在使用者端系統上執行的個人化智慧型搜尋引擎整合器 工具(稱作Uwrsa整合器),來幫助使用者選擇多個合適的搜尋引擎如國外 的Yahoo、AltaVista、Excite、InfoSeek、WebCrawler及國內的Gais、 Monster等,並將搜尋到之文件加以整合,以便快速地協助使用者找尋喜 好的文件。 本系統使用一前向式鏈結推論機以產生搜尋計畫(search plan)來選擇合適的搜尋引擎之組合,並以多線(multi-thread)平行執行 方式同步啟動多個選定的搜尋工具進行實際的查尋作業,而與搜尋引擎的 溝通使用一搜尋語言資料庫以動態產生特定搜尋指令及搜尋結果首頁剖 析(parse)方法來進行,各搜尋返回的文件列依我們所提出的一個新的排 序演算法來重新排序整合並將重複文件過濾刪除後包裝為首頁文件再回覆 給使用者。對於個人的喜好,本系統則以一統計式學習法(learning method)來記錄使用者最近喜好文件之主題分類及搜尋來源,以計算各搜 尋引擎之文件提供能力,以提供下一次搜尋計畫產生之參考。本系統相關 之軟體功能已在Windows NT環境下發展完成,由於本整合器能補足單一搜 尋引擎在功能上的不足及減低使用搜尋引擎所發生的困擾,對使用者而言 ,能有效地縮短文件找尋時間並提高搜尋作業的成功率。
|