跳到主要內容

臺灣博碩士論文加值系統

(18.205.192.201) 您好!臺灣時間:2021/08/05 02:04
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蔡鎮陽
研究生(外文):Tsai Chan Yang
論文名稱:提升主題檢索成效機制之研究
論文名稱(外文):A study of the mechanism on the promoting the effectiveness of topic-A study of the mechanism on the promoting the effectiveness of topic-based information retrieval.
指導教授:曾元顯曾元顯引用關係
指導教授(外文):Yuen-Hsien Tseng
學位類別:碩士
校院名稱:輔仁大學
系所名稱:圖書資訊學系
學門:傳播學門
學類:圖書資訊檔案學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:94
中文關鍵詞:資訊檢索文件排序檢索
外文關鍵詞:Document RerankingNTCIRChinese IRlabel propagationrelevance feedback
相關次數:
  • 被引用被引用:0
  • 點閱點閱:702
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:3
從過去NTCIR3、4、5屆的會議論文中,分析出能提升的檢索效能的機制,假設在,「最佳效能的參賽團隊提供的機制能有效的提升檢索成效」。日本NTCIR會議學術交流環境之下,參賽團隊會將檢索機制說明於會議文件之中,即便說明不清楚,也可能於相關技術文章之中討論。本研究目的,在於有效的分析NTCIR跨語言檢索任務的最佳技術文件,從中取得該團隊的技術,供本研究實驗驗證。
分析實驗系統、各優秀團隊提出的機制之後,本研究最終篩選出「I2R文件二次排序」、「HKPU文件標題排序」、「Label Propagation歸類二次排序」,並且和「PRF查詢擴展」比較。實驗結果發現文件二次排序的方式都無法提升成效,而PRF查詢擴展能有效穩定的提升成效。
From the experience gained from participating in the past NTCIR workshops, we learn that the major factors that affect retrieval effectiveness are: indexing schemes, retrieval models, query expansion techniques, and document re-ranking methods.
We compared I2R document re-ranking, HKPU title re-ranking, label propagation, K-nearest neighboring, and pseudo relevance feedback for document re-ranking and found that pseudo relevance feedback is a more robust technique for performance improvement, while label propagation and K-nearest neighboring are sensitive to the choice and the number of relevant documents for successful document re-ranking. I2R document re-ranking and HKPU title re-ranking cannot improve performance.
目次
誌謝 i
摘要 ii
目次 iii
第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 2
第三節 研究貢獻 3
第四節 名詞解釋 4
第五節 研究限制 8
第二章 文獻探討 9
第一節 日本NTCIR檢索會議 9
第二節 FJUIR於NTCIR使用的檢索機制 20
第三節 文件排序研究 31
第三章 研究方法與設計 44
第一節 研究方法 44
第二節 研究流程與架構 46
第三節 研究設計 50
第四章 實驗結果與分析 59
第一節 以查詢詞特徵調整相似度 60
第二節 以初次查詢排序調整相似度 66
第三節 綜合評估 79
第五章 結論與建議 85
第一節 結論 85
第二節 建議 86
參考文獻 87
附錄A NTCIR 5 CLIR中文查詢問題 91
江玉婷(1999)。現行之重要資訊檢索測試集介紹/TREC。民國九十五年五月二日,取自:http://lips.lis.ntu.edu.tw/ytchiang/study/test/TREC.htm
江玉婷、陳光華(1998)。TREC現況及其對資訊檢索研究之影響。國立臺灣大學圖書資訊學系,台北市。
陳光華(2001)。資訊檢索系統的評估-NTCIR 會議,台灣大學圖書資訊學系四十週年系慶研討會(頁69-73)。
陳光華(2004)。資訊檢索的績效評估。2004 年現代資訊組織與檢索研討會論文集(頁129-136)。
陳光華、莊雅蓁(2001)。資訊檢索之中文詞彙擴展。資訊傳播與圖書館學,8-1,60-70。
陳光華、陳信希 (2004)。CIRB030 資訊檢索測試集簡介。中華民國計算語言學學會通訊。中華民國計算語言學學會,台北市。
陳光華、陳信希(2005)。跨語言資訊檢索與擷取測試集。民國九十六年六月二日,取自:http://www.csie.ntu.edu.tw/~ciet/form/paper/1.doc
陳致榮(2002)。引言與摘要–第六章:前組合式標引與主題標目。民國九十五年五月二日,取自:http://research.pork.idv.tw/master/ok06.htm
曾元顯(1997)。關鍵詞自動擷取技術與相關詞回饋。民國九十五年五月二日,取自:http://www.lins.fju.edu.tw/~tseng/papers/feedback.htm
黃慕萱(1996)。資訊檢索。臺北市:臺灣學生書局。
葉至誠(2000)。社會科學概論。臺北市:揚智。
蔡育欽(2005)。查詢擴展之詞彙篩選應用於主題檢索之研究,碩士論文,私立輔仁大學圖書資訊學系,台北縣。
Singhal, A., Salton, G., & Buckley C. (1996). Length Normalization in Degraded Text Collections, Proceedings of Fifth Annual Symposium on Document Analysis and Information Retrieval(pp. 149-162).
Zhai, C., & Lafferty, J.(2001). A study of smoothing methods for language models applied to ad hoc information retrieval. In Proceedings of SIGIR’01( pp 334–342).
Guarino, N. (1997). Understanding, building and using ontologies. International journal of human and computer studies, 46(3/4), 219-310.
Fang, H., Tao, T., & Zhai, C. X. (2004). A Formal Study of Information Retrieval Heuristics.Proceedings of the 27th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 49-56). U.K: Sheffield.
Jaime, C., & Jade, G.(1998). The Use of MMR, Diversity-based Reranking for Reordering Documents and Producing Summaries. Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval.( pp. 335-336). Australia: Melbourne.
Chen, J., Rowena, Li, & Li, F. (2005). Chinese Information Retrieval Using Lemur: NTCIR-5 CIR Experiments at UNT. Proceedings of NTCIR-5 Workshop Meeting. Japan: Tokyo.
Min, J., Sun, L. & Zhang, J. (2005). ISCAS in English-Chinese CLIR at NTCIR-5. Proceedings of NTCIR-5 Workshop Meeting, Japan: Tokyo.
Yang, L., Ji, D. & Tang, L.(2004). Chinese Information Retrieval Based on Terms and Ontology. Working Notes of NTCIR-4, Japan: Tokyo.
Yang, L., Ji D., Zhou, G., Nie, Y., & Xiao, G. (2001). Document re-ranking using cluster validation and label propagation. Proceedings of the 15th ACM international conference on Information and knowledge management CIKM '06( pp. 690– 697).
Singhal, A.(2001). Modern information retrieval: A brief overview. Bulletin of the IEEE Computer Society Technical Committee on Data Engineering(24(4), pp. 35–43).
Mitra, M., Singhal, A., &. Buckley, C.(1998). Improving Automatic Query Expansion. Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (pp.206-214)
NTCIR (2006). Overview. Retrieved MAY 4, 2006, from http://research.nii.ac.jp/~ntcadm/outline/prop-en.html
Ricardo, B. Y., & Berthier, R. N.(1999). Modern Information Retrieval. New York: Addison Wesley.
Robertson, S. E. (1990). On term selection for query expansion. Journal of Documentation, 46, 359-364.
Robertson, S. E., & Sparck Jones, K.(1994). Simple, Proven Approaches to Text Retrieval.Computer Laboratory, University of Cambridge.
Robertson, S. E., & Walker, S. (1994). Some Simple Effective Approximations to the 2-Poisson Model for Probabilistic Weighted Retrieval. Proceedings of the 17th annual international ACM SIGIR conference on Research and development in information retrieval(pp. 232-241). Ireland:Dublin.
Sakai, T., Kajiura, M., & Sumita, K. (1998). Generation and Evaluation of Search Queries using Boolean Expressions and Document Structure for Information Filtering (in Japanese). IPSJ Journal, 39(11), 3076–3083.
Singhal, A., Buckley, C., & Mitra, M. (1996). Pivoted Document Length Normalization. Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrievl (pp.21-29). Zurich: ACM SIGIR.
Fujtta S. (2005). A Decade after TREC-4 NTCIR-5 CLIR-J-J Experiments at Yahoo! Japan. Proceedings of NTCIR-5 Workshop Meeting, Japan: Tokyo.
TERC (2004). Overview. Retrieved MAY 4, 2006, from http://trec.nist.gov/overview.html
TERC (2007). TREC Tracks. Retrieved July 17, 2007, from http://trec.nist.gov/tracks.html
He, T., Qu, G., Tu, X., & JI, D.(2004). Chinese Information Retrieval Based on Related Term Group, Proceedings of NTCIR-5 Workshop Meeting. Japan: Tokyo.
Xiao,Y., Luk, R.W.P., Wong, K.F., & Kwok, K.L. (2005). Some Experiments with Blind Feedback and Re-ranking for Chinese Information Retrieval. Proceedings of NTCIR-5 Workshop Meeting, Japan: Tokyo.
Yang, L, & Ji, D.(2005). I2R at NTCIR5 . Proceedings of NTCIR-5 Workshop Meeting, Japan: Tokyo.
Tseng, Y. H., Tsai, C. Y. & Chuang,C. J. (2007). On the Robustness of Document Re-Ranking Techniques: A Comparison of Label Propagation, KNN, and Relevance Feedback. Proceedings of the Sixth NTCIR Workshop on Research in Information Access Technologies - Cross-Lingual Information Access, Japan: Tokyo.
Tseng, Y. H., Tsai. Y. C., & Lin C. J. (2005). Comparison of Global Term Expansion Methods for Text Retrieval. Proceedings of NTCIR-5 Workshop Meeting, Japan: Tokyo.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top