跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.84) 您好!臺灣時間:2024/12/09 17:43
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:王海霞
研究生(外文):Hai-Sia Wang
論文名稱:應用概念地圖於FAQ檢索之研究
論文名稱(外文):The Study of Applying Concept Map on FAQ Retrieval
指導教授:翁頌舜翁頌舜引用關係
指導教授(外文):Sung-Shun Weng
學位類別:碩士
校院名稱:輔仁大學
系所名稱:資訊管理學系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:97
中文關鍵詞:常見問題概念地圖K-means分群關聯規則
外文關鍵詞:Frequently Asked QuestionConcept mapK-means clusteringAssociation rule
相關次數:
  • 被引用被引用:0
  • 點閱點閱:340
  • 評分評分:
  • 下載下載:25
  • 收藏至我的研究室書目清單書目收藏:0
傳統的資訊檢索方式多以關鍵詞為主,其缺點為:容易產生資訊過載的情形、查詢關鍵詞大多模糊不清和不精確的問題,導致使用者於搜尋時,產生許多不相關資訊或是找不到查詢結果。目前國內的FAQ(Frequently Asked Questions)網站及國內外文獻在FAQ檢索上,均以關鍵詞、自然語言之方式進行檢索。由於使用者的表達不同,而產生使用者與系統認知差異,以致於使用者找不到符合其需求的資訊。本研究藉由建構概念地圖將FAQ問題以視覺化方式呈現,提供使用者瀏覽找尋相關問題,以改善使用關鍵詞與自然語言檢索之缺點。
本研究利用概念地圖方法,萃取出代表該問題之關鍵詞,並以K-means演算法進行問題分群,接著,對問題分群之結果利用關聯規則產生各群問題之概念規則,最後,將概念規則連結形成概念地圖。本研究對於問題分群結果以精確度(Precision)、回應率(Recall)、F-Measure評估其問題分群效果的好壞,而概念規則之代表性則以專家方式對其進行評估,並以精確度、回應率、F-Measure比較一般關鍵詞檢索與利用概念地圖檢索之檢索效果。
經由本研究實驗之結果,利用概念地圖進行檢索,其檢索結果雖未有明顯之提昇,但其在檢索之精確度、回應率之表現則較關鍵詞檢索時有相對高的情形。此外,本研究的實驗資料於台北市市長信箱與中華電信資料中有出現跨類別問題之情形,然而,若依據其原先人工分類之類別未必適合,本研究針對此部分提出新的分類建議,並根據兩種不同特性之實驗資料探討此方法適合之資料特性,以達到較好的搜尋結果。
It is a conventional way using keywords on information retrieval. The disadvantages are information overloading, ambiguous query terms and imprecise queries. So far, domestic FAQ websites and the related literatures on FAQ retrieval mostly have used keywords and natural language for information retrieval. Because of the different expressions of users, it could have cognitive differences between users and systems so that users could not find any information. Therefore, using concept maps to represent FAQ questions with visualization for searching relevant questions will improve the disadvantages of using keywords and natural language.
The purpose of this study is to apply the method of concept map for FAQ question retrieval. First, extracting the keywords to represent the questions by using k-means clustering algorithm for question clustering. Second, using association rules to produce concept rules in each question cluster. Finally, connecting concept rules to form a concept map. The measures of precision, recall and F-measure are used to evaluate the results of question clustering. The representativeness of concept maps is evaluated by computing the values of precision, recall and F-measure and also compared with the results of using keywords.
The experiments of this study show that the results of using concept maps on information retrieval are not very significant, however, the performance on precision and recall is relatively higher than using keyword retrieval. Moreover, there is one problem with questions belonging to two clusters in this study in the collection of Taipei City Mayor Mail data and Chunghwa Telecom FAQ data. This problem is because artificially classified questions are not appropriate. This study proposes a new suggestion on classification. We explore the characteristics of two different data and the methods to be used in order to have better searching results.
目 錄
頁次

表  次........................................................vii
圖  次........................................................ix
第壹章 緒論....................................................1
第一節 研究背景、動機...........................................1
第二節 研究目的.................................................5
第三節 研究問題.................................................6
第四節 研究範圍.................................................7
第五節 論文架構.................................................7
第貳章 文獻探討.................................................11
第一節 資訊檢索.................................................11
第二節 FAQ相關文獻..............................................16
第三節 概念地圖.................................................22
第四節 中文斷詞.................................................31
第參章 研究方法.................................................35
第一節 研究架構.................................................35
第二節 概念地圖的建立............................................37
第三節 檢索系統評估方式..........................................47
第肆章 實驗設計與結果分析........................................49
第一節 實驗設計.................................................49
第二節 實驗流程.................................................51
第三節 實驗結果.................................................61
第伍章 結論與建議...............................................81
第一節 研究結果與結論............................................81
第二節 研究貢獻.................................................84
第三節 研究限制.................................................85
第四節 未來研究方向............................................. 85
參考文獻.........................................................87
附 錄 一、中文斷詞標記列表................................. ........95


表  次

表 3-1:中文斷詞結果...................................... ........38
表 3-2:正規化後的關鍵詞權重值............................. ........40
表 3-3:WEKA分群後的結果.................................. ........42
表 3-4:某群問題關鍵詞.................................... ........43
表 4-1:實驗環境................................................. 50
表 4-2:關鍵詞分群實驗.................................... ........51
表 4-3:問題關鍵詞分群結果(台北市政府市長信箱FAQ資料)................ 62
表 4-4:調整前與調整後問題關鍵詞分群結果比較(台北市政府市長信箱FAQ資料).67
表 4-5:問題關鍵詞分群結果(中華電信FAQ資料)......................... 69
表 4-6:調整前與調整後問題關鍵詞分群結果比較一(中華電信FAQ資料)........73
表 4-7:調整前與調整後問題關鍵詞分群結果比較二(中華電信FAQ資料)........74
表 4-8:概念規則之比率............................................77
表 4-9:關鍵詞搜尋、概念搜尋之檢索結果.............................. 78
表 A-1:中文斷詞線上展示系統與線上斷詞服務採用之詞類與詞性對照表....... 96



圖  次
圖 1-1:研究流程圖................................................9
圖 2-1:WORDBARS搜尋介面.........................................14
圖 2-2:概念地圖.................................................23
圖 2-3:電加熱氣之語意網路........................................26
圖 3-1:研究架構圖...............................................37
圖 3-2:WEKA參數設定畫面.........................................42
圖 3-3:前項相同產生之關係........................................46
圖 3-4:後項相同產生之關係(信心度相同).............................46
圖 4-1:細部研究架構.............................................52
圖 4-2:FAQ原問題內容............................................53
圖 4-3:CKIP中文斷詞結果.........................................53
圖 4-4:存入資料庫之問題關鍵詞....................................54
圖 4-5:問題關鍵詞之TF*IDF權重值計算(詞性篩選後)....................55
圖 4-6:問題關鍵詞選取(取前二個名詞為例)...........................56
圖 4-7:問題關鍵詞權重值.........................................56
圖 4-8:WEKA問題關鍵詞進行分群之參數設定...........................57
圖 4-9:關聯規則產生之相關參數設定.................................58
圖 4-10:關聯規則選取(兩個關鍵詞)..................................58
圖 4-11:關聯規則選取(三個關鍵詞)..................................59
圖 4-12:概念地圖(部分)........................................... 60
圖 4-13:「網際網路」問題概念之問題列表及問題詳細內容............... 61
圖 4-14:實驗A 台北市政府市長信箱問題分群結果之精確度、回應率(取兩個關鍵詞) ........................................................63
圖 4-15:實驗B 台北市政府市長信箱資料問題分群結果之精確度、回應率(取三個關鍵詞) ........................................................64
圖 4-16:台北市政府市長信箱資料問題分群結果之F值(實驗A、實驗B)比較..... 66
圖 4-17:實驗C 中華電信資料問題分群結果之精確度、回應率(取兩個關鍵詞)...70
圖 4-18:實驗D 中華電信資料問題分群結果之精確度、回應率(取三個關鍵詞)...71
圖 4-19:中華電信資料問題分群結果之F值(實驗C、實驗D)比較..............72
圖 4-20:台北市政府市長信箱、中華電信資料調整前問題分群結果F值平均之比較.75
圖 4-21:台北市政府市長信箱、中華電信資料調整後問題分群結果F值平均之比較.75
參考文獻

一、中文部分
1.中文詞知識庫小組,具有新詞辨識能力的中文斷詞系統,CKIP中文詞知識庫小組,無日期。2007年10月26日,取自:http://rocling.iis.sinica.edu.tw/CKIP/wordsegment.htm。

2.王惠如,以概念地圖導航提升文件搜尋之精確度與回應率,銘傳大學資訊管理學系碩士論文,2006年。

3.吳友仁,支援企業客服中心運作之自動問答與知識摘要技術,國立清華大學工業工程與工程管理學系工業工程組碩士論文,2005年。

4.李坤霖,網際網路FAQ檢索中意圖萃取及語意比對之研究,國立成功大學資訊工程研究所碩士論文,2000年。

5.李孟瑜,智慧型自動化網路客服系統之研究,中華大學資訊工程學系碩士論文,2002年。

6.李怡箴,從客戶服務中心觀點建構使用者導向動態,國立台灣大學資訊管理研究所碩士論文,2003年。

7.邱宏彬、湯鎰聰、陳揮明,數位圖書館個人化檢索與推薦服務之設計與實作,資訊管理研究,第5期,2005年7月,頁1-23。

8.邱登裕、潘雅真,結合資訊檢索與分群演算法建構知識地圖,資訊管理學報,第13卷第S期,2006年10月,頁137-160。

9.張美華,基於自動查詢語句擴展之主題地圖智慧型新聞搜尋引擎,國立花蓮教育大學學習科技研究所碩士論文,2006年。

10.陳文華、施人英、吳壽山,探討文字採掘技術在管理者知識地圖之應用,中山管理評論,第12卷第6期,2004年12月,頁35-64。

11.陳弘哲,自動化建構e-Learning領域之概念圖,國立中山大學資訊管理學系研究所碩士論文,2005年。

12.陳年興、謝盛文、黃琬婷,自動化建構具時間向度之知識結構映射圖—以資訊管理領域之知識及其演進為例,資訊管理學報,第14卷第1期,2007年1月,頁1-32。

13.陳道輝,利用學位論文資訊萃取資訊領域相關研究主題關聯性,國立中山大學資訊管理學系研究所碩士論文,2003年。

14.孫振凱,利用網頁建構知識分布圖,國立中山大學資訊管理學系研究所碩士論文,2002年。

15.陶幼慧、黃清俊、楊誌欽,對線上常見問題解答系統的改進,資訊管理學報,第13卷第2期,2006年4月,頁89-112。

16.彭冠誌,利用隱含回饋提供搜尋引擎上的自動修正查詢,國立政治大學資訊科學學系碩士論文,2006年。

17.曾元顯,關鍵詞自動擷取技術之探討,中國圖書館學會會訊,第106 期,1997年9月,頁26-29。

18.黃居仁,漢字知識表達的幾個層面:字、義與詞義關係概論,漢字與全球化國際學術研討會論文集,台北:臺北市政府文化局,2005年1月,頁77-88。

19.黃純敏、吳郁瑩,網路中文文件自動摘要,台灣區網際網路研討會TANET’99,高雄:國立中山大學,1999年。

20.黃煜翔,自動化網路客服系統之改良研究,中華大學資訊工程學系碩士論文,2003年。

21.楊亨利、溫鳳翔,對線上常見問題解答系統的改進,資訊管理學報,第11卷第2期,2004年4月,頁1-33。

22.鄭百勝,應用關聯規則建構具有方向性之領域知識結構圖—以資訊管理領域為例,國立中山大學資訊管理研究所碩士論文,2006年。

23.蕭瑞祥、謝明釗,運用知識地圖於數位學習教材設計之研究,資訊管理學報,第16卷第1期,2009年1月,頁163-180。

二、英文部分
1.Blake, C. and Pratt, W., Better Rules, Fewer Features: A Semantic Approach to Selecting Features from Text, Proceedings of the IEEE International Conference on Data Mining (ICDM’01), 2001, pp.59-66.

2.Buzan, T. and Buzan, B., The Mind Map Book: How to Use Radiant Thinking to Maximize Your Brain’s Untapped Potential, New York: Plume, 1996.

3.Chmielewski, T. L. and Dansereau, D. F., Enhancing the Recall of Text: Knowledge Mapping Training Promotes Implicit Transfer, Journal of Educational Psychology, 90(3), 1998, pp.407-413.

4.Cho, W. C. and Richards, D., Improvement of Precision and Recall for Information Retrieval in a Narrow Domain: Reuse of Concept Analysis, Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence(WI’04), Washington D.C., IEEE Computer Society, 2004, pp.370-376.

5.Davenport, T. H., and Prusak, L., Working Knowledge: How Organizations Manage What They Know, Mass: Harvard Business School Press, 1998.

6.Fisher, K. M., Semantic Networking: The New Kid on The Block, Journal of Research in Science Teaching, 27(10), 1990, pp.1001-1018.

7.Gordon, J. L., Creating Knowledge Maps by Dependent Relationships, Knowledge-Based Systems, 13(2), 2000, pp.71-79.

8.Haddad, M. H., Chevallet, J. P. and Bruandet, M. F., Relations between Terms Discovered by Association Rules, Proceedings of the 4th European conference on Principles and Practices of Knowledge Discovery in Databases PKDD'2000 Workshop on Machine Learning and Textual Information Access, Lyon France, 2000.

9.Hammond, K., Burke, R., Martin, C. and Lytinen, S., FAQ Finder: A Case-Based Approach to Knowledge Navigation, Proceedings of the 11th Conference on Artificial Intelligence for Applications, Washington D.C., IEEE Computer Society, 1995, pp.80-86.

10.Hoeber, O. and Yang, X. D., Interactive Web Information Retrieval Using WordBars, Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence, Washington D.C., IEEE Computer Society, 2006, pp.875-882.

11.Jansen, B. J. and Pooch, U., A Review of Web Searching Studies and a Framework for Future Research, Journal of the American Society for Information Science and Technology, 52(3), 2001, pp.235-246.

12.Kang, I., Park, Y. and Kim, Y., A Framework for Designing a Workflow-Based Knowledge Map, Bussiness Process Management Journal, 9(3), 2003, pp.281-294.

13.Ma, W. Y. and Chen, K. J., Introduction to CKIP Chinese Word Segmentation System for the First International Chinese Word Segmentation Bakeoff, Proceedings of ACL Second SIGHAN Workshop on Chinese Language Processing, Association for Computational Linguistics, 17, 2003, pp.168-171.

14.McCagg, E. C. and Dansereau, D. F., A Convergent Paradigm for Examining Knowledge Mapping as a Learning Strategy, The Journal of Educational Research, 84(6), 1991, pp.317-324.

15.Mento, A. J., Martinelli, P. and Jones, R. M., Mind Mapping in Executive Education: Applications and Outcomes, The Journal of Management Development, 18(4), 1999, pp.390-416.

16.Novak, J. D., Concept Maps: What the heck is this?, Making Concept Maps(Novak), no date. Retrieved October 25, 2007, from the World Wide Web: http://www.msu.edu/~luckie/ctools/.

17.Novak, J. D. and Cañas, A. J., The Theory Underlying Concept Maps and How to Construct Them, Technical Report IHMC CmapTools 2006-01, Florida Institute for Human and Machine Cognition, 2007. Retrieved October 1, 2007 from the World Wide Web: http://cmap.ihmc.us/Publications/ResearchPapers/TheoryUnderlyingConceptMaps.pdf .

18.Novak, J. D. and Gowin, B., Learning How to Learn, Cambridge : Cambridge University, 1984.

19.Novak, J. D. and Musonda, D., A Twelve-Year Longitudinal Study of Science Concept Learning, American Educational Research Journal, 28(1), 1991, pp.117-153.

20.Ricardo, B. Y. and Berthier, R. N., Modern Information Retrieval, England: Addison-Wesley, 1999.

21.Roiger, R. J. and Geatz, M. W., Data Mining A Tutorial-Based Primer, Boston: Addison-Wesley, 2003.

22.Salton, G. and McGill, M. J., Introduction to Modern Information Retrieval, New York: McGraw-Hill, 1983.

23.Sneiders, E., Automated FAQ Answering: Continued Experience with Shallow Language Understanding, AAAI Fall Symposium on Question Answering Systems Technical Report FS-99-02, 1999, pp.97-107.

24.Spink, A.,Wolfram, D., Jansen, B. J. and Saracevic, T., Searching the Web: The Public and Their Queries, Journal of the American Society for Information Science and Technology, 52(3), 2001, pp.226-234.

25.Sterne, J., Customer Service on the Internet: Building Relationships, Increasing Loyalty, and Staying Competitive, New York: John Wiley and Sons, 1996.

26.Storey, V. C., Burton-Jones, A., Sugumaran, V. and Purao, S., CONQUER: A Methodology for Context-Aware Query Processing on the World Wide Web, Information System Research, 19(1), 2008, pp.3-25.

27.Tiwana, A., The Knowledge Management Toolkit: Practical Techniques for Building a Knowledge Management System, NJ: Prentice Hall PTR, 2000.

28.Tsai, C. H., MMSEG: A Word Identification System for Mandarin Chinese Text Based on Two Variants of the Maximum Matching Algorithm, Chih-Hao Tsai's Home, 12, Mar. 2000. Retrieved October 25, 2007, from the World Wide Web: http://technology.chtsai.org/mmseg/.

29.Turetken, O. and Sharda, R., Visualization of Web Spaces: State of the Art and Future Directions, ACM SIGMIS Database, 38(3), 2007, pp.51-81.Retrieved December 1, 2007, from ACM SIGMIS Database on the World Wide Web: http://portal.acm.org/.

30.Vail, E. F., Knowledge Mapping: Getting Started with Knowledge Management, Information Systems Management, 16(4), 1999, pp.16-23.

31.Warner, D., Richter, J. N., Durbin, S. T. and Banerjee, B., Mining User Session Data to Facilitate User Interaction with a Customer Service Knowledge Base in RightNow Web, Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM, 2001, pp.467-472.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top