(3.232.129.123) 您好!臺灣時間:2021/02/26 21:40
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:楊宸彥
研究生(外文):Chen-Yan Yang
論文名稱:運用剖析概念圖進行中文詢答之研究
論文名稱(外文):Chinese Question Answering Using Parser-Generated Conceptual Graphs
指導教授:陳信希陳信希引用關係
指導教授(外文):Hsin-Hsi Chen
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊工程學研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:124
中文關鍵詞:詢答概念圖剖析剖析器語意詞庫中文剖析器格位
外文關鍵詞:QAQuestion AnsweringparserparsesemanticlexiconChinese parserCase Frame
相關次數:
  • 被引用被引用:8
  • 點閱點閱:284
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:36
  • 收藏至我的研究室書目清單書目收藏:1
在知識爆炸的時代,每天產生成千上萬的文件和資料,如何由其中迅速可靠地找到自己需要的內容,是知識經濟的一項重要課題。目前的網際網路搜尋引擎,利用資訊檢索 (Information Retrieval, IR) 的技術,讓使用者可以透過鍵入少數幾個關鍵詞,找到網路上可能的資料文件,再連結到來源網站閱讀文件,確認是否為自己需要的資料文件。然而這樣的方式,使用者仍然要花費許多時間在眾多文件中找尋正確答案。
詢答系統 (Question Answering System, 簡稱QA System) 則是利用擷取答案的方式,從文件中直接找出使用者所要的答案,答案也許是單一詞,也許是50 字元長度或250 字元長度(在TREC QA競賽中的規定),相較於原來讓使用者檢查整篇文件,詢答系統可以大大減少使用者找尋資料的時間。
詢答系統找尋答案的方式,可利用關鍵詞比對,亦可利用探討語意的方式。探討語意的方式較為複雜,卻可以去探討使用者意念上真正想問的問題,進而找到正確答案。而關鍵詞比對雖然也可以找到答案,然而在未瞭解使用者語意的前提下,一定會找到一堆不相關的答案,使用者仍須耗費相當多的時間去篩選與判斷。
本文經由剖析句子的語法,得到代表語意的剖析概念圖,作為詢答系統的核心,並測試此種方式對詢答系統的效能,進而與一般利用關鍵詞為核心的詢答的系統比較。本文實作了一個中文的剖析器,可剖析的句子大約為七成,完全正確者大約為兩成五。
基本的想法是利用中研院詞庫小組提供的「中文語言處理的基本詞彙及語法知識庫」(簡稱中文詞知識庫)製作中文剖析器,利用剖析器剖析文件及問題得到剖析概念圖,再利用概念圖的比對,得到所要的答案。雖然概念比對詢答效能受到剖析器效能的影響,但是仍能提供一個幫助關鍵詞比對更加確定答案的方式。
摘要 (Abstract) I
內容目錄 (Table of Contents) III
附表目錄 (List of Tables) VI
附圖目錄 (List of Illustrations) VIII
第1章 緒論 (Introduction) 1
1.1 動機 (Motivation) 1
1.2 詢答系統介紹 (Introductions to QA System) 2
1.2.1 何謂詢答 (What is Question Answering) 2
1.2.2 由語意切入 (Using Semantics to Solve the Issues) 3
1.2.3 剖析概念圖 (Parser-Generated Concept Graphs) 4
1.3 目標 (Goal) 4
1.4 編排 (Overview) 5
第2章 文獻探討 (Previous Works) 7
2.1 邏輯式 (Logic Form) 7
2.1.1 來由 (History) 7
2.1.2 利用方式 (Applications) 8
2.1.3 優缺點 (Pros and Cons) 9
2.2 語意式 (Semantic Form) 9
2.2.1 來由及利用方式 (History and Applications) 9
2.2.2 優缺點 (Pros and Cons) 10
2.3 概念圖 (Conceptual Graphs) 11
2.3.1 來由 (History) 11
2.3.2 優缺點 (Pros and Cons) 11
2.4 訊息為本的格位語法 (Information-based Case Grammar) 12
第3章 系統概觀 (System Overview) 13
3.1 系統規格 (System Specification) 13
3.2 系統介紹 (Introductions to System) 14
3.2.1 問題分析(Question Analysis) 14
3.2.2 文件處理(Document Processing) 15
3.2.3 答案產生(Answer Generation) 15
3.3 系統流程(System Flow) 16
3.3.1 問題處理流程(Question Processing Flow) 16
3.3.2 文件處理流程(Document Processing Flow) 17
3.3.3 答案擷取流程(Answer Extracting Flow) 18
第4章 剖析器實作 (Parser Implementation) 21
4.1 剖析簡介 (Introduction to Parsing) 21
4.2 中文詞知識庫介紹 (Introduction to CKIP Lexicon) 23
4.2.1 知識庫的主要架構與成分 24
4.2.2 知識庫的規則對映至無語境詞組結構律 27
4.3 剖析流程 (Flow of Parsing) 27
4.3.1 表式剖析法(Chart Parsing) 27
4.3.2 邊的新增方式(Ways of Adding Edge) 30
4.3.3 剖析演算法 (Parsing Algorithm) 31
4.3.4 剖析演算法探討 (Discussion of Parsing Algorithm) 32
4.4 剖析器效能分析 (Analysis of Performance of Parser) 33
4.4.1 分析方法 (Method of Analysis) 33
4.4.2 結果分析 (Result Analysis) 35
4.4.3 剖析器效能討論 (Discussion of the Performance of the Parser) 37
4.5 剖析器剖析結果擷取 (Extract Result of Parsing) 42
4.5.1 多棵樹時的作法 (Method to Multiple Trees) 42
4.5.2 沒有剖析樹時的作法 (Method to No Tree) 43
4.5.3 效能分析 (Analysis of Performance) 43
第5章 詢答系統 (QA System) 45
5.1 概念圖產生 (Generation of Conceptual Graph) 45
5.1.1 由單一剖析樹產生 (Generate From Single Parsing Tree) 45
5.1.2 前後文相關概念圖 (Context-sensitive Conceptual Graph) 49
5.2 概念圖相似度衡量 (Measurement of Similarity of Conceptual Graphs) 51
5.2.1 衡量特性種類 (Types of Measurement) 51
5.2.2 概念本身之間的相似度衡量 (Measure Similarity between Concepts) 54
5.2.3 由概念所接鄰近概念衡量相似度 (Measure Similarity From Neighbor Concepts) 55
5.3 問句分析 (Analysis of Question) 57
5.3.1 問句類型與相關資訊 (Question Type and Related Information) 57
5.3.2 前後文相關詢答 (Context Question Answering) 59
5.3.3 是否問句的相似度分數計算 (Calculate the Score of Similarity of Yes/No Question) 60
5.3.4 目標問句的相似度分數計算 (Calculate the Score of Similarity of Target Question) 61
5.4 概念比對與關鍵詞比對的差異 (Differences Between Concept Matching and Keyword Matching) 63
5.4.1 在「是否問句」中的差異 (Differences in Yes/No Questions) 63
5.4.2 在「目標問句」中的差異 (Differences in Target Questions) 65
5.5 目標問句詢答效能測試 (Tests of QA System Performance of Target Questions) 66
5.5.1 測試語料及問句製作 (Test Corpus and Questions) 66
5.5.2 測試、比較方式 (Ways to Test and Compare) 68
5.5.3 結果分析 (Analysis of Results) 68
5.5.4 討論 (Discussions) 70
第6章 結論及未來工作 (Conclusions and Future Works) 73
6.1 結論 (Conclusions) 73
6.1.1 詢答系統 (Question Answering System) 73
6.1.2 剖析器 (Parser) 74
6.2 未來工作 (Future Works) 74
參考文獻 (References) 75
附錄 (Appendix) 77
A. 詢答測試語料之答案相關前後文 (Context of the Answer) 77
B. 中文詞知識庫相關資料 (Related Information of CKIP Lexicon) 81
B.1 詞庫架構 (Structure of Lexicon) 81
B.2 角色 (Role) 85
B.3 組成規則操作元 (Operator) 87
B.4 詞組限制 (Phrase Constraint) 87
B.5 詞性限制 (Function Constraint) 89
B.6 特徵限制 (Feature Constraint) 93
B.7 特殊規則 (Special Rules) 100
C. TREC詢答競賽介紹 (Introduction to TREC Question Answering Track) 101
D. 本文相關程式說明 (Illustrations of Related Programs) 103
D.1 檔案轉換程式 (File Transformation Program) 104
D.2 瀏覽程式 (Browser Program) 105
D.3 剖析程式 (Parser Program) 106
D.4 詢答程式 (Question Answering Program) 110
Alshawi H. (1992) “The Core Language Engine” The MIT Press Cambridge, Massachusetts London, England, 1992.
Black, E.; Abney, S.; Flickenger, D.; Gdaniec, C.; Grishman, R.; Harrison, P.; Hindle, D.; Ingria, R.; Jelinek, F.; Klavans, J.; Liberman, M.; Marcus, M.; Roukos, S.; Santorini, B. and Strzalkowski, T. (1991) “A procedure for quantitatively comparing the syntactic coverage of English grammars”, Proceedings of DARPA Speech and Natural Language Workshop, pages 306#311, Pacific Grove, 1991.
Chen, K.J. (1996) “A Model for Robust Chinese Parser”, Computational Linguistics and Chinese Language Processing vol.1, no.1, August 1996, pp. 183-204
Harabagiu, S. Pasca, M. and Maiorano, S. (2000) “Experiments with Open-Domain Textual Question Answering”, Proceedings of COLING-2000, August 2000, Saarbruken Germany, pages 292-298.
Harabagiu, S.; Moldovan, D.; Pasca, M.; Mihalcea, R.; Surdeanu, M.; Bunescu, R.; Girju, R.; Rus, V. and Morarescu, P. (2001) “The Role of Lexico-Semantic Feedback in Open-Domain Textual Question-Answering”, Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics (ACL-2001), July 2001, Toulouse France, pages 274-281.
Harabagiu, S. (2001) “Just-In-Time Question Answering”, Invited talk in Proceedings of the Sixth Natural Language Processing Pacific Rim Symposium (NLPRS-2001), November 2001, Tokyo, Japan, pages 27-34.
Hirschman, L. and Gaizauskas, R. (2001), “Natural Language Question Answering: The View from Here”, Natural Language Engineering, Cambridge University Press, 2001.
Moldovan, D. and Rus, V. (2001) “Logic Form Transformation of WordNet and its Applicability to Question Answering”, Proceedings of the ACL 2001 Conference, July 2001,Toulouse, France
Moldovan, D.; Harabagiu, S.; Pasca, M.; Mihalcea, R.; Goodrum, R.; Girju, R. and Rus, V. (2000) “The Structure and Performance of an Open-Domain Question-Answering System”, Proceedings of the 38th Meeting of the Association for Computational Linguistics (ACL-2000), Hong Kong, October 2000, pages 563-570.
Pasca, M. and Harabagiu, S. (2001) “Answer Mining from On-Line Documents”, Proceedings of the ACL-2001 Workshop on Open-Domain Question Answering, July 2001, Toulouse France, pages 38-45.
Sowa, J. F. (1984) “Conceptual Structures: Information Processing in Mind and Machine” IBM Systems Research Institute, 1984.
Zajac, R. (2001) "Towards Ontological Question Answering", ACL-2001 Open Domain Question Answering Workshop, July 6, 2001, Toulouse.
林甫雯 (1992) “ICG中的論旨角色” 中研院資訊所語言所中文詞知識庫小組 技術報告92-01
詞庫小組 (1993) “中文詞類分析(三版)” 中研院資訊所語言所中文詞知識庫小組 技術報告93-05
陳克健、黃居仁及中文詞知識庫小組 (1995) “訊息為本的格位語法與其剖析方法” 中研院資訊所語言所中文詞知識庫小組 技術報告95-03
陳鳳儀、蔡碧芳、陳克健、黃居仁 (1999)“中文句結構樹資料庫 (Sinica Treebank) 的構建”中研院資訊所語言所中文詞知識庫小組
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 周伯乃:<西方文藝思潮對我國六十年代文學的影響>,(台北:《文訊》,13期1984年)。
2. 林燿德:<在歷史的轉機地開闢小說和人生的出入境口,評施叔青「遍山洋紫荊」>,(台北:《文訊》,1996年1月),頁14∼15。
3. 邱貴芬:<「你看我是女人嗎?」:從「蝴蝶君」看後殖民性別問題的曖昧空間>,(台北:《中外文學》,281期,1995年10月)。
4. 吳佳陵:<種子不死:嚴歌苓筆下的海外華人>,(台北:《國立台北師範學院 傳習》,17期,1999年4月),頁139∼148。
5. 李歐梵:<中國現代文學的現代主義:文學史的研究兼比較>,(台北:《現代文學》,復刊14期,1981年)。
6. 沈冬青:<香江過客半生緣:施叔青和她的香港>,(台北:《幼獅文藝》,486期,1994年),頁52∼58。
7. 艾之玉:<中國妓女的起源與演變>,(台北:《歷史月刊》,1996年12月號),頁32∼35。
8. 王德威:<殖民世界的性與政治:評施叔青的「香港三部曲」之二「遍山洋紫荊」>,(台北:《讀書人》,十一期,1996年1月),頁24∼25。
9. 王曾才:<英國殖民香港的由來與殖民體制>,(台北:《歷史月刊》,1996年7月號)。
10. 孫遲:<揭開象徵的面具>,(台北:《幼獅文藝》32卷12期1970年12月),頁253∼263。
11. 莊宜文:<張派小說的女性意識>,(台北:《中國現代文學理論季刊》,14期),頁164∼187。
12. 張靜茹:<殖民地的浮世繪:施叔青「香港的故事」系列中的人性物化現象>,(台北:《中國現代文學理論季刊》,15期),頁402∼426。
13. 陳秀芳:<如是我寫:與施叔青一席談>,(台北:《幼獅文藝》,41卷4期,1975年4月),頁212∼224。
14. 郭少棠:<香港與中國:歷史的反思和後殖民的境況>,(台北:《歷史月刊》,102期,1996年7月),頁64∼68。
15. 廖炳惠:<從蝴蝶到洋紫荊:管窺施叔青的「香港三部曲」之一、二>,(台北:《中外文學》,24卷12期,1996年5月)。
 
系統版面圖檔 系統版面圖檔