(34.237.124.210) 您好!臺灣時間:2021/03/02 07:29
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:劉偉樑
研究生(外文):Wei-Liang Liu
論文名稱:應用文本探勘技術於奇幻小說敘事結構之分析
論文名稱(外文):Analyzing the Narrative Structure in a Fantasy Fiction Using Text Mining Technology
指導教授:林頌堅林頌堅引用關係
指導教授(外文):Sung-Chien Lin
學位類別:碩士
校院名稱:世新大學
系所名稱:資訊傳播學研究所(含碩專班)
學門:傳播學門
學類:一般大眾傳播學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
語文別:中文
論文頁數:73
中文關鍵詞:自然語言處理中文斷詞長詞優先法主題模型敘事結構
外文關鍵詞:Natural Language ProcessingChinese Word SegmentationMaximum Matching AlgorithmTopic ModelLatent Dirichlet AllocationNarrative Structure
相關次數:
  • 被引用被引用:3
  • 點閱點閱:2309
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:198
  • 收藏至我的研究室書目清單書目收藏:2
奇幻小說是一種以神話或傳說為故事主軸,並具有各種幻想元素的小說形式。近年許多奇幻小說都曾被改編為電視劇、電影或遊戲等各種不同形式的文本。惟奇幻小說通常字數龐大,故事情節交錯,欲掌握其脈絡,進而改編創作更是困難。本研究嘗試提出一套運用電腦自然語言處理技術從文本當中探索敘事結構的方法,以解決解析奇幻小說不易的問題。本研究以《龍槍編年史》三部曲奇幻小說作為此方法之測試文本,採用長詞優先法之分詞演算法針對中文文本進行分詞處理,再透過Latent Dirichlet Allocation主題模型演算法探索出隱含於小說中的主題。本研究根據結果,分析主題與章節之間的對應情形,發現潛藏於書名下的卷冊主題,並再以敘事結構的角度分析主題在文本中的分佈情形,呈現《龍槍編年史》三部曲的敘事脈絡。
Fantasy Fiction is a type of fiction that full of unlimited imagination, which stories are told with myths or legends. Many fantasy fiction works had been adapted for types suitable to movies, TV series or video games in the recent years. However, a fantasy fiction usually comes with millions of word and the story in it is so complicated, such that it is difficult to be understood in a glance and to be adapted easily. This study proposed a method that helps solve the difficulty of analyzing a fantasy fiction by using a series of Natural Language Processing technique to explore the narrative structure inside the fiction. Major algorithms of the proposed method include the Maximum Matching Algorithm for Chinese Word Segmentation and the Latent Dirichlet Allocation Algorithm to extract the topics inside the text of the fiction. The text of the Chinese version of Dragonlance Trilogy was used as the data for testing the method. This study also analyzed the relation between the resulting topics and the original chapters of the fiction to present its narrative context.
圖目次………iii
表目次………v
第一章 緒論………1
 第一節 研究背景與動機………1
 第二節 研究目的與問題………4
 第三節 研究限制………4
第二章 文獻探討………5
 第一節 敘事學………5
 第二節 篇章分析………8
 第三節 中文自然語言分詞處理………10
 第四節 主題模型………12
  一、潛在語意分析(LSA)………13
  二、機率性潛在語意分析(PLSA)………15
  三、潛在Dirichlet分佈(LDA)………17
  四、小結………18
第三章 研究方法………19
 第一節 研究架構………19
 第二節 前置準備………20
 第三節 中文自然語言分詞處理………21
 第四節 主題模型演算………23
  一、匯入文件………24
  二、停用詞過濾………25
  三、模型參數評估………26
  四、主題模型運算與輸出………27
第四章 研究結果………29
 第一節 龍槍編年史簡介………29
 第二節 中文自然語言分詞處理結果………31
  一、訓練結果………31
  二、新增詞語………33
 第三節 主題模型參數評估與運算結果………38
 第四節 主題模型與敘事結構分析………42
  一、各部曲代表性主題:主題27、22與86………42
  二、主角:主題188與主題63………45
  三、冒險隊伍的潰散:主題138與主題22………48
  四、貴人的出現:主題162………50
  五、雷斯林:主題81………50
第五章 結論與建議………53
 第一節 結論………53
  一、章節與主題之對應情形………54
  二、主題組成情形:隊伍發展階段………54
  三、主題組成情形:男女主角………55
  四、主題組成情形:潛在的要角………55
  五、主題組成情形:關鍵貴人………55
  六、敘事結構………55
 第二節 未來研究建議………56
參考文獻………59
Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent Dirichlet Allocation. Journal of Machine Learning Research, 3(4-5), 993-1022.
Blei, D. M. (2012). Probabilistic Topic Models. Communication of the ACM, 55, 77-84.
Bradford, R. (2005). Efficient Discovery of New Information in Large Text Databases, Proceedings. IEEE International Conference on Intelligence and Security Informatics, Vol. 3495, 374–380.
Chatman,S. (1978). Story and Discourse: Narrative Structure in Fiction and Film Ithica. New York: Cornell University Press.
Chen, B. Yeh, Y. M., Huang, Y. M. & Chen, Y. T. (2006). Chinese Spoken Document Summarization Using Probabilistic Latent Topical Informaton. The 31st IEEE International Conference on Acoustics, Speech, and Signal Processing, 1, 969-972.
Chen, K. J., & Liu, S. H. (1992). Word Identification for Mandarin Chinese Sentences. Proceedings of the Fifteenth International Conference on Computational Linguistics, Nantes: COLING-92.
Deerwester, S. C., Dumais, S. T., Landauer, T. K., Furnas, G. W., & Harshman, R. A. (1990). Indexing by Latent Semantic Analysis. JASIS, 41(6), 391-407.
Dragonlance. (2015, Febuary 3). In Wikipedia, the free encyclopedia. Retrieved Febuary 3, 2015, from http://en.wikipedia.org/wiki/Dragonlance
EMC (2011). World Data More Than Doubling Every Two Years—Driving Big Data Opportunity, New IT Roles. Retrieved 22 Oct, 2014 from http://www.emc.com/about/news/press/2011/20110628-01.htm
Foucault, M. (1971). The Order of Discourse. In Y. Roberts(Ed.)(1981). In Untying the text: A poststructuralist reader(pp.48-78). London: Routledge.
Goh, C. L., Asahara, M., & Matsumoto, Y. (2005). Chinese Word Segmentation by Classification of Characters. International Journal of Computational Linguistics and Chinese Language Processing, 10(3), 381-396.
Halliday, M. A. K. (1973). Explorations in the functions of language. London: Edward Arnold.
Harris, Zellig S. (1952b.) Discourse Analysis. Language 28:1.1-30.
Hilbert, M. (2012). How Much Information Is There in the “Information Society”? Significance, 9(4), 8–12.
Hofmann, T. (1999). Probabilistic Latent Semantic Indexing. Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval (SIGIR-99).
Hofmann, T. (2003). Collaborative Filtering via Gaussian Probabilistic Latent Semantic Analysis. Proceedings of the 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 259-266.
Jenkins, H. (2006). Convergence Culture: Where Old and New Media Collide. New York: New York University Press.
Karypis, G., Han, E. (2000). Fast Supervised Dimensionality Reduction Algorithm with Applications to Document Categorization and Retrieval. Proceedings of CIKM-00, 9th ACM Conference on Information and Knowledge Management, 12-19.
McCallum, Andrew Kachites. "MALLET: A Machine Learning for Language Toolkit." http://mallet.cs.umass.edu. 2002.
Mrva, D. & Woodland, P. C. (2004). A PLSA-based Language Model for Conversational Telephone Speech. 8th International Conference on Spoken Language Processing.
Padgett, D., & Allen, D. (1997). Communicating Experiences: A Narrative Approach to Creating Service Brand Image. Journal of Advertising, 26, 49-62.
Shankar, A., Elliott, R., & Goulding, C. (2001). Understanding Consumption: Contribution from a Narrative Perspective. Journal of Marketing Management, 17, 429-453.
Smith, D. E. (2002). Institutional Ethnography. In T. May(Ed.), Qualitative research in action(pp.17-52). London: Sage.
丁邦新(譯)(1980)。中國話的文法(原作者:趙元任)。香港:香港中文大學。
朱學恆(1998)。奇幻文學(Fantasy Literature)。2014年10月22日,擷取自:http://web.archive.org/web/20091108015725/http://www.lucifer.tw/fantasy/intro/intro.htm
何雅婷(2010)。奇幻文學《納尼亞傳奇》研究(國立臺中教育大學語文教育學系碩博士班碩士論文)。
余清祥(1998)。統計在紅樓夢的應用。政大學報,76,303-327。
吳佳昇(2005)。使用貝氏潛在語意分析於文件分類及資訊檢索(國立成功大學資訊工程學系碩博士班碩士論文)。
林千翔、張嘉惠、陳貞伶(2000)。結合長詞優先與序列標記之中文分詞研究。中文計算語言學期刊,15,161-180。
馬立軒(2012)。台灣奇幻小說之探源與發展研究(中國文化大學中國文學系碩士論文)。
陳岳辰(譯)(2008)。雷斯林傳奇 上 靈魂熔爐(原作者:Margaret Weis)。台灣:奇幻基地出版。
張嘉蕙(2006)。奇幻文學角色的失衡與平衡—以《地海》和《黑暗元素》三部曲為例(國立臺東大學兒童文學研究所碩士論文)。
黃心怡(2008)。奇幻文學中的龍—以《地海》、《魔法森林》和《龍騎士》為例(國立臺東大學兒童文學研究所碩士論文)。
黃光玉(2006)。說故事打造品牌:一個分析的架構。廣告學研究,26,1-26。
劉渼(2008)。創意說故事後敘事模式的教學應用研究。臺北大學中文學報,4,1-34。
劉麗珠(2006)。奇幻文學東西對照看──《西遊記》與《魔戒》英雄歷險之主題研究(國立臺東大學兒童文學研究所碩士論文)。
賴國峰(2004)。台灣中譯奇幻小說出版發展之研究(世新大學資訊傳播學研究所碩士論文)。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔