跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.31) 您好!臺灣時間:2025/12/02 23:03
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:邱中人
研究生(外文):Chung-Ren Chiu
論文名稱:中文新聞摘要
論文名稱(外文):Chinese News Summarization
指導教授:張智星張智星引用關係張俊盛張俊盛引用關係
指導教授(外文):Jyh-Shing JangJyun-Sheng Chang
學位類別:碩士
校院名稱:國立清華大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2000
畢業學年度:88
語文別:中文
論文頁數:36
中文關鍵詞:摘要新聞中式人名關鍵詞
相關次數:
  • 被引用被引用:9
  • 點閱點閱:383
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
傳統上文件摘要可以大略分為四種形式:指示性摘要(Indicative Abstract),資料性摘要(Informative Abstract),評論性摘要(Critical Abstract),摘錄(Extract)。指示性摘要是提示讀者此篇文章的存在,並提供足夠的資訊,使其能決定是否應該閱讀原始文件;而資料性摘要提供豐富的內容資訊,有時甚至用來代替原始文件;評論性摘要是指以摘要的形式對原文作一評論;摘錄是直接由原文字句中選取提供事實資料的文句,段落等的節錄,可能是指示性或資料性的性質。本篇論文所得的摘要屬於摘錄的一種,擷取文件中適當長度的部分,來作為文件內容的摘要。
首先,我們先以郵政總局郵遞區號檢視程式中的台灣省各級行政區區域名稱語料庫為基礎,取出文件中台灣區各級行政區的名稱,再以百家姓語料庫為基礎取出文件中屬於人名的中文詞組。接著,我們利用詞語與詞頻的關係提出一套中文文件自動取詞的方法,來擷取出文件中的關鍵詞。根據中文語詞的長度與在文件中出現頻率給予各個關鍵詞不同的權重。最後,設計一套合理的計分方式,配合文件各語句中各個關鍵詞的權重,給予文件各語句適當的分數。分數最高之語句即為文件之指示性摘要。在專有名詞自動取詞方面,平均精確率約為86%,召回率約為84%。關鍵詞斷詞平均精確度為91%。摘要結果有86%的摘要可以取代明日報之人工摘要。
1.緒論
1.1研究動機
1.2研究方法
2.相關的研究
2.1文件摘要相關研究
2.2中文專有名詞自動取詞相關研究
2.3中文關鍵詞自動斷詞相關研究
3.自動摘要演算法
3.1自動斷句
3.2專有名詞自動取詞
3.2.1地名自動取詞
3.2.2中式人名自動取詞
3.2.3以頭銜做專有名詞自動取詞
3.3關鍵詞自動斷詞
3.3.1基本演算法
3.3.2Stop lists
3.4計算語句權重
4.實驗結果與評估
4.1實驗一資料簡介
4.2實驗一結果與評估
4.2.1 評估方法
4.2.2 專有名詞自動取詞結果評估
4.2.3 關鍵詞斷詞結果評估
4.3 實驗二資料簡介
4.4實驗二結果與評估
5.討論與未來研究方向
5.1討論
5.2未來研究方向
附錄A
附錄B
參考文獻
[1] H.P. Luhn(1958),“An Experiment in Auto-Abstracting”, Proceedings of International Conference on Scientific Information, Washington, D.C., 1958 .
[2] R. Sproat and C. Shih (1990), “A Statistical Method for Finding Word Boundaries in Chinese Text”, Computer Processing of Chinese & Oriental Language, vol. 4, No. 4, March 1990, pp.336-349 .
[3] L.J. Wang(1992), “Recognizing Unregistered Names for Mandarin Word Identification”, Proceedings of Computer Linguistics, 1992, pp.1239-1243 .
[4] J.S. Chang, S.D. Chen, S.J. Ker, Y. Chen, and John S. Liu (1994), “A Multiple-Corpus Approach to Recognition of Proper names in Chinese Texts”, Computer Processing of Chinese and Oriental Languages, vol. 8, No. 1, June 1994, pp.75-85.
[5] 李振昌, 李御璽, 陳信希 (1994), ”中文文本人名辨識問題之研究”, Proceedings of ROCLING VII, 1994, pp.203-222.
[6] R. Sproat, C. Shih, William Gale, and Nancy Chang (1996), “A Stochastic Finite-State Word-Segmentation Algorithm for Chinese”, Computational Linguistics, vol. 22, No. 3, 1996, pp.377-403.
[7] 蘇諼 (1996), “自動摘要法”,中國圖書館學會會報第56期(民國85年6月),頁41-47.
[8] P. N. Fung (1997), “Using Word Signature Features for Terminology Translation from Large Corpora”, 博士論文, Columbia University, 1997 .
[9] H.H. Chen, Y.W. Ding, and S.C. Tsai (1998), “Named Entity Extraction for Information Retrieval”, Computer Processing of Oriental Languages, vol. 12, No. 1, 1998, pp.75-85 .
[10] D.R. Radev, and K.R. McKeown (1998), “Generating Natural Language Summaries from Multiple On-Line Source”, Computational Linguistics, vol. 24, No. 3, 1998, pp.469-500 .
[11] Christopher Manning and Hinrich Scütze, “Foundations of Statistical Natural Language Processing”,The MIT Press, Cambridge, Massachusetts, London, England, 1999.
[12] Y. Wu, James N.K. Liu, K. Wang(1999), “An Approach towards English Automatic Abstraction”, Computational Linguistics & Chinese Language Procsssing, vol. 4, No. 1,Feb 1999, pp.85-101.
[13] 黃聖傑 and 陳信希 (1999), “多文件自動摘要方法研究”, 碩士論文, 國立台灣大學資訊工程所, 台北, 1999.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top