跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.146) 您好!臺灣時間:2025/12/03 09:41
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:郭捷立
研究生(外文):KWOK JIE LI
論文名稱:利用分類演算法來判別早期漢譯佛典之朝代—以東漢、三國、西晉為對象
論文名稱(外文):A Computer-Based Approach for Predicting the Translation Period of Early Chinese Buddhism Translation——Texts from the Eastern Han, Three Kingdoms and Western Jin Periods
指導教授:洪振洲洪振洲引用關係
學位類別:碩士
校院名稱:法鼓佛教學院
系所名稱:佛教學系
學門:人文學門
學類:宗教學類
論文種類:學術論文
論文出版年:2012
畢業學年度:100
語文別:中文
論文頁數:57
中文關鍵詞:中古漢語、漢譯佛典、譯者判別、費雪線性辨別分析法、可變長度n-gram
外文關鍵詞:Ancient ChineseChinese TranslationAuthorship AttributionFisher Linear Discriminant AnalysisVariable Length n-Gram Feature Extraction
相關次數:
  • 被引用被引用:1
  • 點閱點閱:1220
  • 評分評分:
  • 下載下載:78
  • 收藏至我的研究室書目清單書目收藏:0
中國佛教大藏經中的翻譯作品是佛教文化研究的瑰寶,然而當中部分佛經的譯者記錄存疑仍待解決。受限於早期史料難以完整收集的困難,使得佛經翻譯初期的年代——東漢、三國和西晉的佛典譯者問題最嚴重,也最難處理。相對於傳統文獻學的質化分析研究方式,本研究嘗試以統計量化分析搭配資訊技術的方式,來尋求早期佛教譯經作者紀錄的問題之解答。本研究以建立一個能夠準確分析文獻是由上述三個朝代之中的哪一個朝代所翻譯完成之判別機制為主要目的。藉由此研究成果,我們可以找出未知經典最可能的翻譯年代,以進一步縮小可能譯者的比對範圍。在研究過程中,我們先參考傳統文獻學者的研究成果,建立三個朝代的可靠參考翻譯作品清單,之後再利用Variable Length N-gram 的演算法進行文獻特徵值的萃取,並使用「費雪線性辨別分析法」進行判別特徵值判斷。根據實驗結果,此辨別機制之效果十分顯著,其準確度可以至少達到89%以上。此外,我們藉由進一步分析由費雪線性辨別分析法所產生的辨別函式,找出此三個朝代經文在翻譯上所使用的特徵,此特徵能用於分析探討同一個外語詞在三個朝代中被翻譯成不同的語詞的狀況。在本研究聯合機制中,我們發覺這樣的量化分類方式是可以解釋部分的經典翻譯現象。

Buddhism has been spreading in China for more than two thousand years since its first introduction in the Eastern Han dynasty (C.E 25-221), and has become an important part of daily life and culture at large in China. A great number of Buddhist scriptures were translated from Indian originals starting from the Eastern Han dynasty to the Tang
dynasty (C.E. 618-907) and beyond. Scholarship has become increasingly aware, over the last few decades, that traditional authorship and translatorship attribution of the early Chinese works is often unreliable. The current reference edition of the Chinese Buddhist canon (Taishō shinshū daizōkyō (Abbr.: T.) 大正新修大蔵經, collated 1924-1934) contains 3053 works in 85 volumes, including about 1000 texts of Indian (or alleged Indian) provenance. However, ca. 150 of these texts are marked as shiyi 失譯, indicating that the name(s) of the translator(s) are unknown. In addition to such
unknown cases of attribution, for the texts that were translated between the 2nd and the late 6th century, many attributions are uncertain, problematic or simply incorrect.
Text-critical and philological studies have brought a significant advancement of the status of the research in the field. However, traditional philology has its scale limit. The research project the present thesis stems from has thus designed a statistic model employing variable-length n-gram, with Fisher Linear Discriminant, to establish a highly accurate classification mechanism for predicting the translation period of Chinese texts. The time brackets we focus on in the present study include three early
Chinese dynasties: the Eastern Han (C.E. 25-220), the Three Kingdoms (C.E. 220-280) and the Western Jin (C.E. 266-316). These three dynasties constitute the earliest phase of Buddhist translation history and most of the translations from these periods present attribution problems. In this research, we build up classification mechanisms for each of the three dynasties. These can be used to test whether the translation style of a text is similar to the one prevalent during a certain period. According to the output of our experiment, all of the three classifications for three dynasties have an accuracy rate of more than 89%. Also, by examining the classification result, we extract the special translation usages of Chinese sutras in different time period. With the help of statistic information bearing on the characteristics and features of Chinese texts, this approach can not only provide new evidence relevant to uncertain authorships but also encourage Buddhist scholars and scholars of linguistics to do further studies.


目次
中文摘要 i
英文摘要 ii
誌謝 iv
目次 vii
表目次 ix
圖目次 ix
凡例 x
註腳格式: x
外文表示方法: x
參考文獻: x
第一章 動機與目的 1
第二章 文獻回顧 5
第三章 研究方法 10
3.1 時間範圍之劃分 10
3.2 語料之處理 12
3.2.1 從近代研究篩選出訓練樣本 12
3.2.2. 電子全文來源 15
3.2.3. 資料準備 16
3.2.4. 樣本切割 17
3.3 特徵值之處理方式 17
3.4 機器學習 21
第四章 實驗分析 25
4.1 各朝代判別機制之效能評估 27
4.2 各朝代投影值之分佈現象 30
4.3 特徵值權重分析 32
4.3.1 「泥洹」之分析 36
4.3.2 「說法」與「說經」之分析 37
4.4 聯合機制之功效分析 38
4.4.1 樣本判別錯誤中之「佛傳」類別 40
4.4.2 樣本判別錯誤中之「三昧部」類別 41
4.4.3 小結 44
第五章 結論 45
參考文獻 47
(一)佛教藏經或原典文獻 47
(二)中日文專書、論文或網路資源等 47
(三)西文專書、論文或網路資源等 48
(四)工具書與網路資源 49
附錄(一) 50
東漢經錄比較結果 51
三國經錄比較結果 53
西晉經錄比較結果 55

(一)佛教藏經或原典文獻
「中華電子佛典協會」(Chinese Buddhist Electronic Text Association,簡稱CBETA)電子佛典系列,2010 版光碟。
《出三藏記集》。CBETA, T55, no. 2145。
《佛說普曜經》。CBETA, T03, no. 186。

(二)中日文專書、論文或網路資源等
小野玄妙(1983)。《佛教經典總論》。楊白衣譯。台北市:新文豐出版公司。
王力(1980)。《漢語史稿》。北京:中華書局。初版(1957)。
王文顏(1984)。《佛典漢譯之研究》。台北市:天華出版事業有限公司。
太田辰夫(1991)《漢語史通考》。江藍生及白維國譯。重慶巿:重慶出版社。
任繼愈(1985)。《中國佛教史》。北京:中國社會科學出版社。
呂叔湘(1985)。《近代漢語指代詞》。上海:學林出版社。
呂澂(1991)。《新編漢文大藏經目錄》。濟南:齊魯出版社。
竺家寧主持(1997)。《早期佛經詞彙研究:西晉佛經詞彙研究》。行政院國家科學委員會專題研究計畫成果報告。嘉義縣:國立中正大學中國文學研究所。
竺家寧主持(1998)。《早期佛經詞彙研究:三國佛經詞彙研究》。行政院國家科學委員會專題研究計畫成果報告。嘉義縣:國立中正大學中國文學研究所。
竺家寧主持(1999)。《早期佛經詞彙研究:東漢佛經詞彙研究》。行政院國家科學委員會專題研究計畫成果報告。嘉義縣:國立中正大學中國文學研究所。
竺家寧(2009)。〈佛經語言研究綜述──語法的研究〉。《香光佛教圖書館館刊》50。頁40-57。
俞理明(1993)。《佛經文獻語言》。四川:巴蜀書社。
宮崎展昌(2007)。〈「阿闍世王經」(T626)の漢訳者につい〉。《インド哲学仏教学研究》14。頁57-71。
後藤義乘(1978)。〈数理文献学的方法による無量寿経類漢訳者の推定〉。《印度學佛教學研究》26(2)。頁174-175。
後藤義乘(2002)。〈計量文獻學による漢譯者推定〉。《印度學佛教學研究》50。頁791-793。
後藤義乘(2004)。〈計量文獻學による漢譯者推定–無量壽經の漢譯者〉。《印度學佛教學研究》52。頁749-751。
高明道(1983)。《如來智印三昧經翻譯研究》。台北市:中國文化大學碩士學位論文。
曹仕邦(1999)。《中國佛敎史學史—東晉至五代》。台北市:法鼓文化。
許理和(1987)。〈最早的佛經譯文中的東漢口語成分〉。《語言學論叢》14。蔣紹愚譯。頁197-225。
曾亮(2007)。〈三國漢譯佛經代詞研究〉。湖南:師範大學碩士學位論文。
蔣紹愚(2005)。《近代漢語研究概要》。北京:北京大學出版社。
謝國平(2009)。《語言學概論》。台北市:三民書局。初版(1985)。

(三)西文專書、論文或網路資源等
de Jong, J.W. 1968. Buddha''s Word in China, 28th George Ernest Morrison Lecture. Canberra: Australian National University.
Hung, Jen-Jou, Marcus Bingenheimer and Simon Wiles. 2010. “Quantitative Evidence for a Hypothesis regarding the Attribution of Early Buddhist Translations.” Literary and Linguistic Computing 25 (1), pp. 119 -134. doi:10.1093/llc/fqp036.
Kjell, Bradley. 1994. “Authorship Determination Using Letter Pair Frequency Features with Neural Network Classifiers.” Literary and Linguistic Computing 9 (2), pp. 119 -124. doi:10.1093/llc/9.2.119.
Lancaster, Lewis R. and Sung-bae Park. 1979. The Korean Buddhist Canon: A Descriptive Catalogue. USA: University of California Press.
Luyckx, Kim, and Walter Daelemans. 2011. “The Effect of Author Set Size and Data Size in Authorship Attribution.” Literary and Linguistic Computing 26 (1), p.p. 35–55. doi:10.1093/llc/fqq013
Mosteller, F. and Wallace, D. L. 1984. Applied Bayesian and Classical Inference: The Case of the Federalist Papers. Addison-Wesley, Reading, MA.
Nattier, Jan. 2005. “The Proto-History of the Buddhavatamsaka: The Pusa benye jing菩薩本業經 and the Doushajing 兜沙經.” Annual report of the International Research Institute for Advanced Buddhology at Soka University 8, pp. 323-360.
Nattier, Jan. 2008. A Guide to the Earliest Chinese Buddhist Translations Texts from the Eastern Han東漢 and Three Kingdoms 三國 Periods. PDF. Vol. X. Bihliotheca Philologica et Philosophica Buddhica. Tokyo: The International Research Institute for Advanced Buddhology(IRIAB) of Soka University.
Pu, Chengzhong. 2008. Notes on the Chengju Guangming Jing, ‘Sūtra of Achieving the Bright Light Concentration’ Buddhist Studies Review 25, pp. 27–53.
Vetter, Tilmann. 1992. “On the Authenticity of the Ratnāvali.” Asiatische Studien 46, pp. 492-506.
Tambouratzis, George and Marina Vassiliou. 2007. “Employing Thematic Variables for Enhancing Classification Accuracy within Author Discrimination Experiments.” Literary and Linguistic Computing 22 (2), pp. 207 -224. doi:10.1093/llc/fqm003.

(四)工具書與網路資源
中華電子佛典協會 Chinese Buddhist Electronic Text Association. 2011/06/06, http://cbeta.org/.
佛光大辭典編修委員會(1988)。《佛光大辭典》。高雄市:佛光出版社。
佛教藏經目錄數位資料庫 Digital Database of Buddhist Tripitaka Catalogues. 2011/06/06, http://jinglu.cbeta.org/.
香光尼眾佛學院。「佛教圖書館館訊」網站。第24期。2000/12,http://www.gaya.org.tw/journal/m24/24-main4.htm。
Modular toolkit for Data Processing. http://mdp-toolkit.sourceforge.net/, 2012/06/05
Python Programming Language – Official Website. 2012/06/05, http://www.python.org/.


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top