跳到主要內容

臺灣博碩士論文加值系統

(216.73.217.165) 您好!臺灣時間:2026/05/20 07:12
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:董惠珠
研究生(外文):Hui-Zhu Dong
論文名稱:《中阿含經》與《增壹阿含經》之文本翻譯風格量化分析與相似斷詞自動化擷取
論文名稱(外文):Quantitative Analysis of Translation Styles and Automatic Similar Phrases Identification of the Madhyama-āgama and the Ekottarika-āgama
指導教授:洪振洲洪振洲引用關係
學位類別:碩士
校院名稱:法鼓文理學院
系所名稱:佛教學系
學門:人文學門
學類:宗教學類
論文種類:學術論文
論文出版年:2018
畢業學年度:106
語文別:中文
論文頁數:76
中文關鍵詞:中阿含經增壹阿含經翻譯風格量化分析可變長度n-gram主成分分析法最長共同子序列
外文關鍵詞:Madhyama-āgamaEkottarika-āgamatranslation stylequantitative analysisvariable length n-gramprincipal components analysislongest common subsequence
相關次數:
  • 被引用被引用:0
  • 點閱點閱:367
  • 評分評分:
  • 下載下載:58
  • 收藏至我的研究室書目清單書目收藏:0
《大正藏》經號T 26《中阿含經》與T 125《增壹阿含經》,兩經之譯者皆記載為僧伽提婆;對於現存《中阿含經》的譯者記錄,目前學界還沒有人提出異議,但是對於現存《增壹阿含經》的譯者記錄,各家說法不一,學界對此尚無定論。本研究嘗試利用統計量化分析的方式,對《中阿含經》與《增壹阿含經》進行翻譯風格分析,以此探討現存《中阿含經》與《增壹阿含經》是否來自相同譯者的作品。研究方法為:以「可變長度n-gram」(variable length n-gram,VL n-gram)為切詞方法,經由適當的篩選門檻找出風格特徵詞,再搭配主成分分析法(principal components analysis,PCA)進行統計分析,以之觀察兩經的翻譯風格是否具有一致性。分析結果顯示,兩經的翻譯風格有顯著的差異。本研究同時使用人工比對的方式從已經找出來的眾多風格特徵詞中尋找意義相似的斷詞,以此觀察兩個文本是否有用字不同卻是意義相似的詞彙或短語。經過人工判讀後,找到諸多例證顯示兩個文本翻譯風格之差異受到譯者用字習慣的影響。研究結果顯示,現存漢譯《中阿含經》和《增壹阿含經》,有極高的機率不是來自相同譯者的作品。在研究過程中,有鑑於以人工比對所需投入的大量工時,本研究也嘗試尋找一個自動化識別相似斷詞的方法,期能提高研究效率,並且因應日後巨量詞組的比對需求。我們以「最長共同子序列」(longest common subsequence,LCS)作為兩兩斷詞之間相似程度的衡量方法。實驗結果顯示,此衡量方法之成效雖非顯著,然而對於大量詞組的比對,仍不失為一個可用的方法;在演算結果中可能包含著關鍵性的線索,能夠提供學者作為進一步研究之用。
In the Taishō Tripiṭaka, the translators of the Madhyama-āgama (T 26) and the Ekottarika-āgama (T 125) are both attributed to the same person, Gautama Saṅghadeva. So far, no one doubts the translator of the Madhyama-āgama is Gautama Saṅghadeva but there are different opinions among scholars concerning the translator of the Ekottarika-āgama. This study attempts to analyze the translation style of the Madhyama-āgama and the Ekottarika-āgama by quantitative methods, and discuss whether these two collections are the works of a same translator. The research methods are as follows: (1) the variable length n-gram (VL n-gram) is used to split text of T 26 and T 125 into shorter segments, called gram, (2) the grams that are used in more than an arbitrary threshold documents are adopted as “style features”, and (3) applying the principal components analysis (PCA) to the frequency of the style features of T 26 and T 125, the consistency of the translation style of these two collections is analyzed. The results from the statistical analysis show that the translation styles of these two collections are significantly different. In order to further strengthen the analysis results, we manually check the style features of the two collections to look for different phrase but sharing similar meanings in different collections. After the manual comparison, we find many examples indicating that the differences in translation styles between the two collections are indeed affected by the translator’s choice of word. These results again confirm the fact that the Madhyama-āgama and the Ekottarika-āgama are probably not the works of a same translator. Seeing the drawback of manual comparison which required a huge contribution of man-hours, this study also attempts to provide a solution to automatically identify similar phrases in order to reduce the man-hours and improve the research efficiency. We use the longest common subsequence (LCS) as a measurement for the degree of similarity between two phrases. The experimental results show that although the effect of LCS is not as significant, yet it is still a useful method to compare large data of phrases and some computational findings may suggest clues that intrigue further scholastic research.
摘要 i
ABSTRACT ii
誌謝 iv
目次 v
表目錄 vii
圖目錄 viii
第一章 緒論 1
第二章 文獻回顧 9
第三章 文本翻譯風格研究方法 19
(一)文本來源 19
(二)語料處理 21
(三)特徵值選取 21
(四)投入主成分分析運算並繪圖觀測 25
第四章 文本翻譯風格實驗分析 26
(一)最低卷數門檻值設定在20的主成分分析結果 26
(二)最低卷數門檻值設定在40和60的主成分分析結果 28
(三)最低卷數門檻值設定在80、100和111的主成分分析結果 29
(四)主成分分析運算結果小結 32
(五)主成分分析運算結果之gram分析 32
第五章 相似斷詞判讀 36
(一)何謂「相似斷詞」 37
(二)比較詞組 38
(三)人工比對 39
(四)判讀 40
(五)利用「相似斷詞」進行文本風格分析 44
第六章 相似斷詞自動化擷取研究方法 49
(一)最長共同子序列(LCS) 49
(二)精確率、召回率、F1-度量 51
(三)K折交叉驗證 53
(四)同義詞語料 53
第七章 相似斷詞自動化擷取實驗分析 54
(一)訓練最佳LCS相似度分數 55
(二)效能評估與分析 57
(三)加入同義詞 59
(四)加入同義詞後之效能評估與分析 61
(五)相似斷詞自動化擷取研究小結 65
第八章 結論 66
參考文獻 68
一、佛教藏經或原典文獻(依經號排序) 68
二、中日文專書、論文或網路資源等 68
三、西文專書、論文或網路資源等 71
附錄1、歷代經錄之撰出年代及略稱 74
附錄2、加入同義詞之前各組「相似斷詞」的LCS相似度分數 74
附錄3、加入同義詞之後各組「相似斷詞」的LCS相似度分數 75
一、佛教藏經或原典文獻(依經號排序)
「中華電子佛典協會」( Chinese Buddhist Electronic Text Association,簡稱 CBETA)的電子佛典系列光碟(2014年版)。
《中阿含經》。CBETA, T01, no. 26。
《增壹阿含經》。CBETA, T02, no. 125。
《四分律行事鈔資持記》。CBETA, T40, no. 1805。
《歷代三寶紀》。CBETA, T49, no. 2034。
《出三藏記集》。CBETA, T55, no. 2145。
《眾經目錄》(編按:隋 法經等撰)。CBETA, T55, no. 2146。
《眾經目錄》(編按:隋 彥琮等撰)。CBETA, T55, no. 2147。
《眾經目錄》(編按:唐 靜泰撰)。CBETA, T55, no. 2148。
《大唐內典錄》。CBETA, T55, no. 2149。
《大周刊定眾經目錄》。CBETA, T55, no. 2153。
《開元釋教錄》。CBETA, T55, no. 2154。
《貞元新定釋教目錄》。CBETA, T55, no. 2157。
二、中日文專書、論文或網路資源等
(一)中日文專書、論文
王文顏(1993)。《佛典重譯經研究與考錄》。台:文史哲出版社。頁13-54。
李領國(1998)。〈認識阿含經〉。《正覺之音》第35期。1999年12月。美國印順導師基金會「正覺之音」,https://www.yinshun.org/Enlightenment/1999/1999dec/1999dec4.htm,2017/3/15。
季羨林(2007)。《佛教十五題》。北京:中華書局。頁143。
林家安(2009)。〈現存漢譯《增一阿含經》之譯者考〉。圓光佛學研究所畢業論文。桃園:圓光佛學研究所。頁11-12。
林崇安(2010)。〈世出世間--談談《增一阿含經》的譯出〉。《法光》n.250。台北:法光文教基金會。頁1-1。
洪振洲、謝承恩、郭捷立、釋德圓(2012)。〈統計式漢籍佛典譯經風格分析研究---以阿含經譯者:竺佛念、僧伽提婆為例〉。科技部專題研究計畫成果報告。GRB政府研究資訊系統,http://grbsearch.stpi.narl.org.tw/search/planDetail?id=2322904&docId=0 ,2017/3/1。
洪振洲(2016)。〈由資料庫到數位研究平台―談佛典文獻數位研究工具之發展與演變〉。《漢學研究通訊》。35卷1期 (2016 / 02 / 01)。頁1-14。
曹仕邦(1990)。《中國佛教譯經史論集》。台北:東初出版社。(1992年一版二刷)
梁啟超(1976)。〈說四阿含〉。《佛學研究十八篇》。台北:中華書局。
船山徹(2017)。〈佛典漢譯史要略〉。《佛教的東傳與中國化――中國I南北朝》。台北:法鼓文化。頁251-252。
郭捷立(2012)。《利用分類演算法來判別早期漢譯佛典之朝代—以東漢、三國、西晉為對象》。法鼓佛教學院碩士論文。台北:法鼓佛教學院。
黃居仁 (2007-2009)、謝舒凱 (2009-2010):跨語言知識表徵基礎架構─面向多語化與全球化的語言學研究。國科會專題補助計畫 (NSC 96-2411-H-003-061-MY3)。
黃居仁、謝舒凱、洪嘉馡、陳韻竹、蘇依莉、陳永祥、黃勝偉。中文詞彙網路:跨語言知識處理基礎架構的設計理念與實踐。中國語文,24卷第二期。
楊郁文(1987)。〈增壹阿含經題解〉。收錄於《佛光大藏經》〈阿含藏‧增壹阿含經一〉。高雄:佛光出版社。頁4。
萬金川(2002)〈數位時代漢譯佛典研究的展望〉。《正觀雜誌》第20期。南投:正觀雜誌社。頁73-82。
廖學盈(2016)。〈詩經的量化研究:發掘興體詩的隱藏節奏〉。《2016數位典藏與數位人文國際研討會論文集》。台北:臺灣大學數位典藏研究發展中心。頁401-414。
榎本文雄(1988)。〈阿含經典之成立〉。《佛光大藏經》《阿含藏‧附錄上》。高雄:佛光出版社。頁197。
謝承恩(2012)。《以量化分析方法進行漢譯佛典譯者風格研究》。法鼓佛教學院碩士論文。台北:法鼓佛教學院。
蘇錦坤(2007)。〈寶唱《經律異相》所引之阿含經——試論水野弘元教授的〈增一阿含經解說〉〉。《福嚴佛學研究》n.2。新竹:福嚴佛學院。頁91-160。
釋印順(1971)。《原始佛教聖典之集成》。台北:正聞出版社,頁92-93。
釋法持(2014)。〈誰翻譯了《長阿含經.世記經》?以文字統計方法尋找新的證據〉。《第五屆數位典藏與數位人文國際研討會論文集》。台北:臺灣大學數位典藏研究發展中心。頁395-410。
釋聖嚴(2005)。《比較宗教學》。法鼓全集2005網路版。第1輯,第4冊。頁402-403。
釋聖嚴(2005)。《四聖諦講記》。法鼓全集2005網路版。第7輯,第13冊。頁29。
(二)網路資源
中華電子佛典數位研究平台(CBETA數位研究平台),「CBETA線上閱讀」,http://cbetaonline.dila.edu.tw/ , 2015-2018/1/8上網。
佛光山,「佛光大辭典‧線上查詢系統」,https://www.fgs.org.tw/fgs_book/fgs_drser.aspx , 2015-2018/1/8上網。
法鼓文理學院,「大正藏詞彙搜尋與統計分析」,http://dev.dila.edu.tw/TaishoConcordance2/ , 2017-2018/1/8上網。
法鼓文理學院,「佛學術語字辭典」,http://glossaries.dila.edu.tw/?locale=zh-TW , 2015-2018/1/8上網。
法鼓文理學院,「佛學規範資料庫」(包含:時間規範資料庫、人名規範資料庫、地名規範資料庫、佛經目錄規範資料庫),http://authority.dila.edu.tw/ , 2015-2018/1/8上網。
國家教育學院,「教育部重編國語辭典修訂本」,http://dict.revised.moe.edu.tw/cbdic/, 2015-2018/1/8上網。
莊春江工作站,http://agama.buddhason.org/ , 2015-2018/1/8上網。
三、西文專書、論文或網路資源等
Anālayo, Bhikkhu. 2006. “The Ekottarika-āgama Parallel to the Saccavibhaṅga-sutta and the Four (Noble) Truths”, Buddhist Studies Review 23, no. 2, pp. 145-153.
Batjargal, B., Khaltarkhuu, G. & Maeda, A. 2015. “Personal Name Extraction from Mongolian Historical Documents Using Machine Learning”, 《2015數位典藏與數位人文國際研討會論文集》。台北:臺灣大學數位典藏研究發展中心。頁419-430。
Bozkurt, I.N., Bağhoğlu, O. & Uyar, E. 2007. “Authorship Attribution: Performance of Various Features and Classification Methods”. Proceedings of the 22nd International Symposium on Computer and Information Sciences. 2007. doi:10.1109/ISCIS.2007.4456854
David Maier. 1978. “The Complexity of Some Problems on Subsequences and Supersequences”. J. ACM. ACM Press. 25 (2): 322–336. doi:10.1145/322063.322075. [#http://link.springer.com/chapter/10.1007/3-540-58338-6_63]
de Jong, J.W. 1968. Buddha''s Word in China, 28th George Ernest Morrison Lecture. Canberra: Australian National University. P.15.
Demiéville, Paul. 1954. “La Yogācārabhūmi de Saṅgharakṣa.” BÉFEO 44, no. 2, pp. 339-436.
Hung , J. , Bingenheimer M. and Wiles S. 2009. “Quantitative evidence for a hypothesis regarding the attribution of early Buddhist translations”, Literary and Linguistic Computing, 25(1): 119-134; doi: 10.1093/llc/fqp036
Jen-Jou Hung and Bhikkhu Anālayo. 2015 “A Quantitative Textual Analysis of the Translation Idiom of the Madhyama-āgama (T 26) and the Ekottarika-āgama (T 125)," The 3rd Āgama Seminar of the Āgama, Dharma Drum Institute of Liberal Arts. 收錄於Research on the Madhyama-āgama, pp.177-196, 法鼓文化,台北, 2017.
Jolliffe, I.T. 2002. Principal Component Analysis (2nd ed.). USA: Springer.
Kjell, B. 1994. “Authorship Determination Using Letter Pair Frequency Features with Neural Network Classifiers”. Literary and Linguistic Computing. 9(2). pp.119-124. doi:10.1093/llc/9.2.119
Labbe, D. 2007. “Experiment on Authorship Attribution by Intertextual Distance in English”. Journal of Quantitative Linguistics. 14(1). pp.33-80.
Legittimo, Elsa. 2010. “Reopening the Maitreya-files – Two Almost Identical Early Maitreya Sutra Translations in the Chinese Canon: Wrong Attributions and Text-historical Entanglements”. Journal of the International Association of Buddhist Studies. 31, no. 1/2, pp.251-294.
Michael Radich & Bhikkhu Anālayo. 2015. “Were the Ekottarika-āgama and the Madhyama-āgama Translated by the Same Person? An Assessment on the Basis of Translation Style”, The 3rd Āgama Seminar of the Āgama, Dharma Drum Institute of Liberal Arts. 收錄於Research on the Madhyama-āgama, pp.209-237, 法鼓文化,台北, 2017.
Mosteller, F. & Wallace, D. 1984. Applied Bayesian and Classical Inference: The Case of the Federalist Papers. New York: Springer Verlag.
Nattier, Jan. 2010. “Re-evaluating Zhu Fonian''s Shizhu duanjie jing (T309): Translation or Forgery?” Annual Report of The International Research Insitute for Advanced Buddhology at Soka University. 13, pp. 231-258.
SuttaCentral, https://suttacentral.net/, 2016-2018/1/8.
Tearle, M., Taylor, K. & Demuth, H. 2007. “An Algorithm for automated authorship attribution using neural networks”. Literary and Linguistic Computing. 23(4). pp.425-442.
Wold, S., Esbensen, K. & Geladi, P. 1987. “Principal component analysis”. Chemometrics and Intelligent Laboratory Systems. 2(1-3). pp.37-52.
Zhang, D. & Lee, W.S. 2006. “Extracting Key-substring Group Features for Text Classification”. Proceedings of the 12th ACM SIGKDD international conference on Knowledge discovery and data mining. pp.474-483.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top