跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2025/01/13 16:08
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:王笙權
研究生(外文):Wang, Sheng-Chuan
論文名稱:近體詩主題辨識系統研製
論文名稱(外文):Jintishi Processing and Categorization
指導教授:梁婷梁婷引用關係
指導教授(外文):Tyne, Liang
學位類別:碩士
校院名稱:國立交通大學
系所名稱:資訊科學與工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2012
畢業學年度:100
語文別:中文
論文頁數:33
中文關鍵詞:主題分類情感分類詞彙語意消解
外文關鍵詞:Topic ClassificationSentiment ClassificationWord Sense Disambiguation
相關次數:
  • 被引用被引用:0
  • 點閱點閱:238
  • 評分評分:
  • 下載下載:27
  • 收藏至我的研究室書目清單書目收藏:0
近體詩是中國文學的精粹之一,以精簡的文字表達豐富的情感與思想。此外詩作也可能包含大量的典故與對仗,因此近體詩對於一般人而言在理解與創作上存在著一定程度的困難。有鑑於此,本論文利用文本分類技術,以進行近體詩處理研究,並建立一個近體詩主題辨識系統。此系統提供詩作相關查詢及詩作處理功能包括斷詞、概念標記、情感辨識、及內容主題辨識等。本研究將主題辨識歸類成詠物述志、山水田園、情愛閨怨、贈別思友、邊塞征戰、社會民生等六項;情感辨識標註為喜愛、怨怒、哀愁等三項。在主題辨識的實驗中我們以992首七言律詩作為實驗語料,萃取詩作的八種詞彙與概念特徵,以支援向量機(SVM)模組進行辨識。經過tenth-fold cross-validation檢驗,主題辨識的平均正確率為69.12%。以同樣的模組,在情感辨識的實驗中我們以492首七言律詩作為實驗語料,得到70.7%的辨識正確率。
Jintishi is one of the Chinese literature classics. Jintishi reveals rich emotion and thoughts in few words. Jintishi may contain allusions and follows syntactic and semantic parallelisms making them difficult to be understood. Therefore, we used text classification techniques to analyze Jintishi and built up a Jintishi topic identification system. The system provides poem search and poem analysis including word segmentation, semantic tagging, topic identification and emotion identification. We classified Jintishi into six topic categories, namely, Chanting Object, Landscape, Desperate Wife, Farewell, Frontier and Social Poem. Additionally, our system supports emotion categorization, namely, happiness, sadness or anger. We used 992 seven-character Lushi in topic identification labeling experiment. We extracted eight lexical and concept Jintishi features and used support vector machine to identify topics for each poem. We get 69.12% accuracy after ten-fold validation. The emotion identification method was performed and tested too. Using 492 seven-character Lushi as test corpus, we get 70.7% accuracy.
摘要 i
ABSTRACT ii
誌謝 iii
目錄 iv
表目錄 v
圖目錄 vi
第一章 緒論 1
第二章 相關研究 3
2.1 斷詞處理 3
2.2 詞義處理 3
2.3 詩作分類 4
第三章 研究方法及步驟 6
3.1 語料來源 6
3.2 外部辭典建立 7
3.3 斷詞處理 9
3.4 詞彙概念的標記與歧異消解 11
3.5 情感詞標記 14
第四章 實驗語實驗分析 16
4.1 斷詞結果與分析 16
4.2 概念標記結果與分析 17
4.3 情感詞標記結果與分析 18
4.4 特徵定義與特徵選取 19
4.5 主題辨識與情感辨識實驗 20
第五章 系統展示與介紹 24
第六章 結論 27
參考文獻 28
附錄 30
[1] Chih-Chung Chang and Chih-Jen Lin, LIBSVM : a library for support vector machines (2001). Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm
[2] Gerard Escudero and Lluís Màrquez and German Rigau (2004),“An Empirical Study of the Domain Dependence of Supervised Word Sense Disambiguation Systems.”Joint SIGDAT Conference on Empirical Methods in NLP and Very Large Corpor, Hong Kong.
[3] Ling-Yan Li, Zhong-Shi He, Yong Yi(2004), “Poetry Stylistic Analysis Technique Based on Term Connections.” IEEE, 0-7803-8403-2.
[4] Keh-Jiann Chen, Shu-Ling Huang, Yueh-Yin Shih, Yi-Jun Chen(2005), “Extended-HowNet: A Representational Framework for Concepts” , In Proceedings of IJCNLP-05 Workshop on Lexical Semantic, Jeju Island, South Korea, p.p 1-6.
[5] Yong Yi, Zhong-Shi He, Liang-Yan Li, Tian Yu, Elaine Yi (2005), “Advanced studies on traditional Chinese Poetry style identification.” In Proceedings of the Fourth International Conference on Machine Learning and Cybernetics, Guangzhou, China, vol.5, pp. 2936- 2939.
[6] Zhong-Shi He, Wen-Ting Liang, Liang-Yan Li, Yu-Fang Tian(2007), “SVM-Based Classification Method For Poetry Style.” IEEE, 1-4244-0973-X
[7] Rada Mihalcea(2007), “Using Wikipedia for Automatic Word Sense Disambiguation.” In Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.
[8] Likun Qiu, Weishi Zhang, Changjian Hu, Kai Zhao(2009),“A Self-Supervised Model for Sentiment Classification.” Proceedings of CIK’09, November2-6, Hong Kong, China.
[9] Xiaojun Wan (2009), “Co-Training for Cross-Lingual Sentiment Classification.” In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP, Suntec, Singapore, pp. 235–243.
[10] Mitesh M. Khapra, Salil Joshi, Arindam Chatterjee, Pushpak Bhattacharyya(2011), “Together We Can: Bilingual Bootstrapping for WSD.” Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, page 561-569.
[11] 顏崑陽,喜怒哀樂,台北市,月房子,1994。
[12] 許清雲,部編大學用書-近體詩創作理論,臺北市:洪葉文化,1997。
[13] 俞士汶,胡俊峰,“唐宋詩之詞匯自動分析及應用”,北京大學,博士論文,2003年8月。
[14] 朱我芯,「深秋猿鳥來心上,夜靜松杉到眼前」─華文詩歌情境再現,第五屆全球華文網路教育國際研討會,台北,2007年6月。
[15] 孫瑛澤,陳建良,劉峻杰,劉昭麟,蘇豐文,“中文短句之情緒分類”,第22屆自然語言與語音處理研討會,南投,台灣,2010年9月。
[16] 柯淑津,黃居仁,洪嘉馡,劉詩音,簡卉伶,蘇依莉,“中文詞義全文標記語料庫之設計與雛形製作”,第十九屆自然語言與語音處理研討會,2007年9月,台灣大學,台灣。
[17] 羅鳳珠,“植基於中國詩詞語言特性所建構之語意概念分類體系研究”,第九屆海峽兩岸圖書資訊學學術研討會,武漢大學,2008年7月3-6日。
[18] 易勇,何中市,李良炎,周建勇,瞿義玻,“基於遺傳演算法改進詩詞風格判斷的研究”,重慶大學,2005年,計算機科學,32捲,7號。
[19] 劉博榮,“近體詩自動分類研究”,國立交通大學,碩士論文,2010年8月。
[20] 陳紹宜,“建構一個中文對聯創作的知識評價架構”,國立交通大學,碩士論文,2010年6月。

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top