(3.93.75.30) 您好!臺灣時間:2019/09/21 07:07
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
本論文永久網址: 
line
研究生:蔡育欽
研究生(外文):Yu-Chin Tsai
論文名稱:查詢擴展之詞彙篩選應用於主題檢索之研究
論文名稱(外文):Term-Selection for Query Expansion in Topic Information Retrieval
指導教授:曾元顯曾元顯引用關係
指導教授(外文):Yuen-Hsien Tseng
學位類別:碩士
校院名稱:輔仁大學
系所名稱:圖書資訊學系
學門:傳播學門
學類:圖書資訊檔案學類
論文出版年:2005
畢業學年度:93
語文別:中文
論文頁數:105
中文關鍵詞:查詢擴展共現索引典
外文關鍵詞:Query expansionCo-occurrence Thesaurus
相關次數:
  • 被引用被引用:3
  • 點閱點閱:1108
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:65
  • 收藏至我的研究室書目清單書目收藏:5
幫助使用者滿足其資訊需求是資訊檢索技術發展之目標。使用者所輸入的查詢詞彙對檢索結果有著直接且顯著的影響,本研究將以自動化的方式進行查詢擴展進而提升檢索成效。查詢擴展隨著擴充詞之來源不同將之分為局域擴展與全域擴展,局域擴展使用的擴充詞彙來自初次檢索結果中的關鍵詞彙,而本研究中全域擴展使用的是事先建立之共現索引典中的詞彙。目前局域擴展在眾文獻與本研究中皆可證實其穩固之成效,而全域擴展於之前的研究中顯示其成效不夠穩固。故本研究之目的希望建立自動的篩選規則將索引典中與查詢主題相關的詞彙加入初始查詢,提升全域擴展之檢索成效。

我們使用日本NTCIR單語檢索的資料建立實驗所需之環境,利用其提供的多欄位描述方式進行主題檢索。研究中我們先以人工方式篩選關聯詞彙,並根據人工篩選之經驗與文獻之分析結果,提出四種自動化篩選詞彙之策略,並以不同檢索模式與不同擴展方式交叉驗證其檢索成效。除量化分析外,研究也針對查詢主題之描述與篩選出的關聯詞兩者進行觀察分析,了解其對檢索成效之影響。

實驗結果顯示當查詢詞品質較高時,不同檢索模式的成效差異較小,而當查詢詞品質較不一致時,以機率模式檢索成效較高。且當擴展模式為先全域擴展再局域擴展其檢索成效高於單獨使用局域擴展或全域擴展。全域擴展的檢索實驗中,人工的篩選結果有著不錯的成效,足可證實共現索引典於查詢擴展具有相當幫助,而自動化的篩選方式則以計算關聯詞對主題之強度的方式成效較佳,但整體成效幫助有限。由主題需求描述之觀察,發現當主題需求描述使用了較多”多意義詞彙”時,不僅難以查詢擴展提升成效,且檢索成效通常較差。觀察關聯詞對檢索成效之影響,選出的詞彙精確率越高,檢索結果越好,而回收率高但選出的詞彙與主題的關聯度較低時,檢索成效容易變差。
The primary purpose to develop Information Retrieval is to satisfy users’ information need. The influences of query words on the quality of the search results are direct and apparent; therefore, query expansion which suggests more related terms to users is often adopted to improve the effect of information retrieval. According to the different origins of expanded terms, query expansion is divided into two categories: Local Expansion in which the expanded terms are generated from the key words of the first retrieval results; and Global Expansion in which the expanded terms are from the established Co-occurrence Thesaurus. The effectiveness of local expansion is robust according to various earlier researches and this study; however, the effect of global expansion has not brought into full play. Hence, the aim of this study is to heighten the effect of global expansion by establishing an automatic term-selection rule to add related terms from thesaurus into the first retrieval.

The application of Japanese NTCIR Single Language Information Retrieval provides a multi-column description in topic-based information retrieval. In this study, on the base of the experiences of manual selection and the outcomes of literature review, we propose four strategies for automatic global term selection which have been evaluated by distinct retrieval models and various expanded approaches. Apart from the quantitative analysis, this study focuses on the relationship between the descriptions of retrieval topic and the selected related terms as well.

The experiment results show that the difference among varied retrieval models is unobvious with the higher-quality query words; nevertheless, the effect of probability model is better with inconsistent quality query words. The better retrieval outcomes are taken place as the expansion models are developed from applying global expansion first and then local expansion later. In the experiment of global expansion, the usefulness of co-occurrence thesaurus in query expansion is proved by the effective of manual selection; on the other hand, automatic selection is good only when such selection is based on identifying the related degree between related term and topic but only has marginal total effect. The analysis of topic description indicates that the more “polysemy” be used the less effects be produced. In terms of the impact of related terms on the effect of retrieval, we discover that the better results are due to the higher accuracy of selected terms; however, the effectiveness reduces with high recall rate.
第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 3
第三節 研究貢獻 5
第四節 詞彙定義 6
第五節 研究問題 10
第二章 文獻探討 12
第一節 查詢擴展 12
第二節 檢索模式 22
第三節 檢索成效評估 29
第三章 研究方法與設計 34
第一節 研究方法 34
第二節 研究流程與架構 35
第三節 研究設計 38
第四章 實驗數據分析 58
第一節 關聯詞篩選策略之評估 58
第二節 篩選策略之成效 70
第三節 局域擴展與全域擴展搭配不同檢索模式 72
第五章 關聯詞與主題分析 76
第一節 查詢主題特性分析 76
第二節 關聯詞之分析 92
第六章 結論與建議 98
第一節 結論 98
第二節 建議 101
卜小蝶(1996)。圖書資訊檢索技術。台北市:文華。
莊雅蓁(1999)。中文查詢句擴展問句之研究,碩士論文,國立台灣大學圖書資訊學系,台北市。
陳光華(2004)。資訊檢索的績效評估。2004年現代資訊組織與檢索研討會論文集,129-136。
陳光華(2001)。資訊檢索系統的評估-NTCIR會議,台灣大學圖書資訊學系四十週年系慶研討會,69-73。
陳光華、莊雅蓁(2001)。資訊檢索之中文詞彙擴展。資訊傳播與圖書館學,8-1,60-70。
葉至誠,葉立誠(2003)。研究方法與論文寫作。台北市:商鼎文化。
葉佳昀(2004)。中文互動式檢索輔助功能之效益評估-以關聯提示詞為例,碩士論文,私立輔仁大學圖書資訊學系,台北縣。
曾元顯(2001)。共現索引典之自動建構、評估與應用,台灣大學圖書資訊學系四十週年系慶研討會,87-105。
曾元顯(1997)。關鍵詞自動擷取技術與相關詞回饋。上網日期:2005年03月11日。網址:http://blue.lins.fju.edu.tw/~tseng/papers/feedback.htm。
曾元顯,林瑜一(1998)。模糊搜尋、相關詞提示與相關詞回饋在 OPAC 系統中的成效評估。中國圖書館學會會報,61,103-125。
黃慕萱(1996)。資訊檢索。臺北市:臺灣學生。
鄭恆雄(1984)。中文資料索引及索引法。台北市:文史哲。
Cui, Hang., Wen, J. R., Nie, J.Y., & Ma, W.Y.(2002). Probabilistic query expansion using query logs. Proceedings of the 11th international conference on World Wide Web, 325-332.
Harman, D.(1988). Towards Interactive Query Expansion. Proceedings of the 11th annual international ACM SIGIR conference on Research and development in information retrieval, 322-326.
Hui Fang, Tao Tao, ChengXiang Zhai.(2004). A Formal Study of Information Retrieval Heuristics. Proceedings of the 27th annual international conference on Research and development in information retrieval, 50-55.
Kwon,O.W, Kim C.M. & Choi, K.S. (1994).Query Expansion Using Domain-Adapted, Weighted Thesaurus in an Extended Boolean Model. Proceedings of the third international conference on Information and knowledge management, 140-146.
Mandala, R., Tokunage, t., & Tanaka H.(1999). Combining Multiple Evidence from Different Types of Thesaurus for Query Expansion. Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, 191-197.
Mitra, M, Singhal, A., &. Buckley, C.(1998). Improving Automatic Query Expansion. Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval, 206-214.
NII. (2003). README for Topics and Relevance Assessments of NTCIR-3 CLIR Test Collection - . Retrieved March, 15, 2005. From http://reseaarch.nii.ac.jp/ntcir/permission/READMEforTOPICS_FormalRun.htm
Qiu, Y., & Frei, H. P.(1993). Concept Based Query Expansion. Proceedings of the 16th annual international ACM SIGIR conference on Research and development in information retrieval, 166-168.
Ricardo,B.Y.,&Berthier,R.N.(1999).Modern Information Retrieval. New York: Addison Wesley.
Robertson, S. E. (1969). The Parametric Description of Retrieval. Test. Journal of Documentation, 25 (1), 3.
Sakai, T., Kajiura, M., & Sumita, K.(2000). A first step towards flexible local feedback for ad hoc retrieval. Proceedings of the fifth international workshop on on Information retrieval with Asian languages, 95-102.
Tseng, Y. H.(2002). Automatic Thesaurus Generation for Chinese Documents. Journal of the American Society for Information Science and Technology, 1130-1138.
Tseng, Y. H., Juang, D. W., & Chen, S. H. (2004). Global and Local Term Expansion for Text Retrieval. Proceedings of the Forth NTCIR Workshop on Evaluation of Information Retrieval. Retrieved March 23, 2005, from http://research.nii.ac.jp/ntcir-ws4/NTCIR4-WN/CLIR/NTCIR4WN-CLIR-TsengY.pdf.
Xu, J., & Croft, W. B.(1996). Query Expansion Using Local and Global Document Analysis. Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, 4-9.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 邱文彬(2001)。創造力發展模型與教學觀:從全人生發生認識論與建構取向。嶺東學報,4,151-180。
2. 吳靜吉、林偉文、林士郁、王涵儀、陳秋秀、曾敬梅、徐悅淇(2002)。國際創造力教育趨勢及其對我國創造力教育的啟示。學生輔導,79,80-97。
3. 王千倖(1999)。「合作學習」和「問題導向學習」-培養教師及學生的科學創造力。教育資料與研究,28,31-39。
4. 鄔瑞香 林文生(1997)。建構主義在國小數學科教學試煉。教育資料與研究,18,44-50。
5. 甄曉蘭(1995)。合作行動研究─進行教育研究的另一種方式。嘉義師院學報,9,297-318。
6. 甄曉蘭、曾志華(1997)。建構教學理念的興起與應用。國民教育研究學報,3,179-208。
7. 蔡榮貴(1991)。從皮亞傑發展認識論之觀點探討兒童〝數〞概念之發展。教師之友,53(1),20-25。
8. 劉世南、郭誌光(2001)。創造力的概念與定義。資優教育季刊,81,1-7.
9. 魏美惠(1994)。創造力的認識與培養。台中師範學院幼兒教育年刊,7,117-129。
10. 簡良平(1999)。科技整合之『問題-解決』教學策略可行性探討。課程與教學季刊,2(3),103-116。
11. 陳光華、莊雅蓁(2001)。資訊檢索之中文詞彙擴展。資訊傳播與圖書館學,8-1,60-70。
12. 曾元顯,林瑜一(1998)。模糊搜尋、相關詞提示與相關詞回饋在 OPAC 系統中的成效評估。中國圖書館學會會報,61,103-125。
 
系統版面圖檔 系統版面圖檔