跳到主要內容

臺灣博碩士論文加值系統

(44.192.22.242) 您好!臺灣時間:2021/08/01 12:33
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:郭家良
研究生(外文):Jia-liang Kau
論文名稱:新聞事件群聚及摘要檢索研究
論文名稱(外文):A Study and Implementation of News Event Clustering and Summarization Search Engine
指導教授:黃純敏黃純敏引用關係
指導教授(外文):Chuen-min Huang
學位類別:碩士
校院名稱:國立雲林科技大學
系所名稱:資訊管理系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2004
畢業學年度:92
語文別:中文
論文頁數:76
中文關鍵詞:事件偵測事件追蹤關聯法則分析多文件摘要新聞檢索
外文關鍵詞:Event TrackingMulti-document SummarizationAssociation RuleEvent DetectionNews Retrieval
相關次數:
  • 被引用被引用:7
  • 點閱點閱:374
  • 評分評分:
  • 下載下載:59
  • 收藏至我的研究室書目清單書目收藏:0
本研究主要是利用TDT(Topic Detection and tracking)群聚及與分類之技術,將網路新聞文件依事件分群,進一步提供使用者傳統分類瀏覽架構之外,另一種更直覺的新聞閱讀方式。利用本研究所建置之新聞事件瀏覽器,使用者能在線上閱讀及比較同一事件中,各家新聞入口網站之報導,以獲取對該事件完整及詳盡的了解。此外,藉由追蹤事件的發展,隨著時間的演進,將新的相關新聞文件歸類至適當的事件群集中,讓使用者更能掌握該事件發展的來龍去脈。研究中為降低群聚謬誤的發生,結合資料挖採中關聯法則分析技術,針對新聞事件產生關聯法則,並將此關聯法則回饋至新聞事件內,藉此降低新聞群聚謬誤的發生,進一步提供使用者更精確的事件結果。

有鑒於新聞事件報導經常動輒數十篇,甚或近百篇,困擾讀者判讀新聞事件之內容。故本研究在新聞事件形成後,針對新聞事件產生多文件摘要,協助使用者快速了解新聞事件內容及節省閱讀時間。儘管本機制提供使用者方便的瀏覽介面,為顧及使用者檢索需求,研究中加入新聞檢索功能,除提供使用者多元檢索機制外,更結合關聯法則分析之結果,進一步衍生使用者所輸入的關鍵字詞,提升檢索效率。

評估結果發現,有近七成受測者對於本研究事件內之新聞相關性、事件標題以及對於完整了解事件內容皆有正面評價;而有近八成受測者認為事件摘要的確有效幫助使用者判讀事件主題。此外,相較於關鍵詞檢索功能,有七成以上受測者認為關聯法則檢索更能有效幫助使用者搜尋其感興趣之新聞事件。
This research applies Topic Detection and Tracking technique which is both a clustering and classification method to group news reports into different clusters based on news event. In addition to a traditional browsing way based on category classification, this study also provides a more intuitive way of reading news. It is expeted to provide, news readers a more complete picture about one specific news event due to this effort. Besides, in order to give news reader a complete report about one news event, this research will group new coming news report into its own news event.

To reduce the probability of clustering error, this study also utilizes a data mining technique—association rule— to screen out unrelated news reports. Furthermore, this research provides a brief summany of each event by using multi-document summarization technique.

The evaluation result shows that seventy percentage of users agree that news reports for the same news event are well-connected, and the title of each news event is helpful to understand the content. Moreover, about eighty percentage of users think that the summary of news event is useful for realizing the news event. Besides, seventy percentages of users favor the way of retrieval with association rule more than the way of searching by traditional keyword method.
中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
圖目錄 VI
表目錄 VII
第一章 緒論 1
1-1研究背景與動機 1
1-2 研究目的 2
1-3 研究範圍與限制 2
1-4 研究貢獻 2
第二章 文獻探討 4
2-1 字詞處理技術 4
2-1-1 中文斷詞處理 4
2-1-2 字詞權重計算 5
2-2 人名辨識 5
2-3 向量空間模型 6
2-3-1 向量表示法 7
2-3-2 詞彙-文件矩陣 7
2-3-3 相似度計算 8
2-4文件分群方法 9
2-5 新聞事件偵測與追蹤 9
2-5-1 事件偵測 10
2-5-2 事件追蹤 10
2-6 文件摘要技術 11
2-6-1 文件摘要的定義 11
2-6-2 文件摘要的分類 12
2-6-3 中文多文件摘要 12
2-7 關聯式法則挖掘技術 13
2-7-1 Apriori演算法 13
2-8 資訊檢索 15
第三章 系統架構 16
3-1 系統架構 16
3-2 網路新聞收集器 17
3-3事件偵測與追蹤 18
3-3-1 斷句與斷詞 19
3-3-2 人名辨識 19
3-3-3 字詞權重計算 22
3-3-4 事件偵測 23
3-3-5 事件追蹤 24
3-3-6 效能調整 24
3-3-7 新聞事件群聚結果統計 25
3-3-8 標題詞彙權重提升及人名辨識導入之群聚結果分析 26
3-4多文件摘要 27
3-4-1 斷句與斷詞 28
3-4-2 群聚語句 28
3-4-3 形成多文件摘要 29
3-5 新聞知識擷取 30
3-5-1 新聞事件關聯法則擷取 30
3-5-2 新聞事件關聯法則門檻值訂定分析 31
3-5-2 新聞事件關聯法則回饋結果分析 33
3-6 新聞事件檢索 34
3-7 新聞事件偵測與追蹤與多文件摘要結果呈現 35
3-8 使用者介面 37
第四章 系統評估 40
4-1 評估項目 40
4-1-1 受測者基本資料 40
4-1-2 新聞事件偵測與追蹤之效益評估及新聞事件之判讀摘要、完整摘要效益評估 41
4-1-3 關鍵詞檢索系統及關聯法則檢索系統效益評估 41
4-2 受測者基本資料分析 42
4-3 新聞事件偵測與追蹤之效益評估及新聞事件之判讀摘要、完整摘要效益評估 43
4-4 關鍵詞檢索系統及關聯法則檢索系統效益評估 47
第五章 結論與未來展望 50
5-1 研究成果 50
5-2 研究討論 52
5-3 未來展望 53
參考文獻 54
附錄A 中文之停用字 56
附錄B 系統評估問卷 58
1.黃燕萍,1999,「中文社會新聞文件資訊擷取」,國立雲林科技大學資訊管理研究所碩士論文。
2.戴尚學,2003,「運用事件偵測與追蹤技術於中文多文件摘要之研究」,國立雲林科技大學資訊管理研究所碩士論文。
3.黃純敏,吳郁瑩,1999,網路文件自動摘要,台灣區網際網路研討會TANET 99,國立中山大學承辦。
4.梅家駒,竺一鳴,高蘊琦,殷鴻翔,1996,「同義詞詞林」,出版地:上海辭書出版社。
5.陳鴻儀,2001,「應用關聯法則於語言模型之調整及建立個人化新聞文件瀏覽器」,國立成功大學資訊工程研究所碩士論文。
6.顧皓光,1996,「網路文件自動分類」,國立台灣大學資訊管理研究所碩士論文。
7.Agrawal, R., and R. Srikant, 1994, Fast Algorithms for Mining Association Rules, Proceedings of the Very Large Data Bases Conference, Vol. 20.
8.Allan, J., J. Carbonell, G. Doddington, J. Yamron, and Y. Yang, 1998, Topic Detection and Tracking Pilot Study Final Report, Proceedings of the DARPA Broadcast News Transcription and Understanding Workshop.
9.Chen, H., H. Ding, Y.W. Tsai, S.C. and G.W. Bian, 1998, Description of the NTU System Used for MET2, Proceedings of Message Understanding Conference, Vol. 7.
10.Han, J. and M. Kamber, 2001, Data Mining: Concepts and Techniques, San Francisco: Morgan Kaufmann.
11.Cheung, L., B.K. Tsou and M.S. Sun, 2002, Identification of Chinese Personal names in Unrestricted Texts, Proceedings of the Pacific Asia Conference, Vol. 16, Korea.
12.Miller, D., R. Schwartz, R. Weischedel and R. Stone, 1999, Named Entity Extraction for Broadcast News, Proceedings of DARPA Broadcast News Workshop.
13.Papka, R., 1999, "On-line New Event Detection: Clustering and Tracking", PhD thesis, University of Massachusetts Amherst.
14.Rush, J.E., R. Salvador and A. Zamora, 1971, "Automatic abstracting and indexing. II. Production of indicative abstracts by application of contextual inference and syntactic coherence criteria", Journal of the American Society for Information Science, Vol. 22, No. 3, pp. 260-274.
15.Salton, G.., 1988, Automatic Text Processing, Addison-Wesley Longman Publishing Conference.
16.Salton, G. and M.J. McGill, 1983, Introduction to Modern Information Retrieval, New York: McGraw-Hill Co.
17.Sun, J., J.F. Gao, L. Zhang, M. Zhou and C. Huang, 2002, Chinese named entity identification using class-based language model, Proceeding of the International Conference on Computational Linguistics, Vol. 19, pp. 967-973.
18.Yang, Y., T. Ault, T. Pierce and W.C. Lattimer, 2000, Improving text categorization methods for event tracking, Proceedings of the Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Vol. 23.
19.Yang, Y., J. Carbonell, R. Brown, T. Pierce, B.T. Archibald and X. Liu, 1999, "Learning approaches for detecting and tracking news events", IEEE Intelligent Systems, Vol. 14, No. 4, pp. 32-43.
20.Yang, Y., T. Pierce and J. Carbonell, 1998, A Study on Retrospective And On-Line Event Detection, Proceedings of the Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Vol. 21.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊