(3.236.175.108) 您好!臺灣時間:2021/02/28 02:38
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:羅丞邑
研究生(外文):Cheng-Yi Luo
論文名稱:以資料探勘之技術解決線上客語語音合成系統中多音字發音歧義之研究
論文名稱(外文):A Research on Resolving Pronunciation Ambiguity of Polyphonic Characters by using Data Mining Techniques in an On-Line Hakka Text-to-Speech System
指導教授:余明興余明興引用關係
口試委員:林義証晁瑞明
口試日期:2011-07-27
學位類別:碩士
校院名稱:國立中興大學
系所名稱:資訊網路多媒體研究所
學門:電算機學門
學類:網路學類
論文種類:學術論文
論文出版年:2011
畢業學年度:99
語文別:中文
論文頁數:87
中文關鍵詞:客語多音字語音合成系統詞義辨識
外文關鍵詞:HakkaPolyphonic charactersText-to-speech
相關次數:
  • 被引用被引用:2
  • 點閱點閱:133
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
近年來由於政府的政策,以及少數族群意識的抬頭,鄉土文化與方言教學逐漸受到重視,由於現代網際網路非常發達,因此靜態的學習資訊幾乎是隨處可得,但動態輔助學習的工具則略顯不足。因此我們著手建立客語系統,採用以詞為合成單元的架構,並在各詞間加入適當的停頓,以及對多音字的判斷,使發音結果清晰,讓人可以輕鬆聽懂。
我們的重點放在多音字的處理,從一字兩音、一字三音等,各挑選出幾個來做模型訓練。我們用決策樹分類器訓練出多音字模型,並以此預估當文句中含有不在字典中的多音字時,該多音字應發哪種音。最後把預估的結果合成語音,並進行線上的聽測實驗,結果顯示,本系統所產生的客語合成語音具有真人說話之自然與清楚的特性。


This thesis aims at the implementation for Hakka Text-to-Speech (TTS) System on Internet. Our system is composed of four components as follows: Text analysis, Mandarin to Hakka, Prosody prediction, and Speech generation module. More than 5400 monosyllabic speech units and 4063 word speech units of Hakka and several silences with various durations have been recorded as basic unit for speech synthesis. By adding breaks to Hakka sentences and finding out the pronunciation of polyphonic characters appropriately, we can provide real synthesis speech with frequent, prosodic and natural quality on Internet .
We focus on solving pronunciation ambiguity of polyphonic characters, i.e., to determine which pronunciation should be chosen. We predict pronunciation by using Bayesian network classifier、 C4.5 decision tree classifier、 CART classifier, and SVM classifier. The result of our experiments show that we can handle the prediction of some words very well in our Hakka Text-to-Speech System.


誌謝. ii
摘要. iii
Abstract iv
第一章 緒論 1
1.1 研究動機 1
1.2 數位學習簡介 2
1.3 研究方向 3
1.4文獻探討 6
1.5論文架構 7
第二章 客語四縣腔語海陸腔介紹 9
2.1客語在臺灣的分佈 9
2.2 四縣及海陸腔調簡介 11
2.3 聲調表示 13
2.4 四縣腔及海陸腔連音變調 15
第三章 詞典、語音庫與語音合成系統模組介紹 19
3.1 詞典與語音庫 19
3.1.1 中文詞典 20
3.1.2 國客語對照詞典 21
3.1.3 語音庫 23
3.2文句分析模組 24
3.3韻律訊息模組 27
3.3.1能量前處理-正規化 27
3.3.2停頓的類型 29
3.4語音合成模組 31
第四章 多音字介紹及研究方法 37
4.1 多音字介紹 37
4.2 監督式與非監督式方法 37
4.3 貝氏網路分類器 39
4.4 C4.5決策樹與CART決策樹 42
4.5 SVM支援向量機 45
第五章 語音合成系統實作 48
5.1 系統架構 48
5.1.1 運作流程 48
5.1.2 資料庫 49
5.2 文句分析 51
5.2.1實驗的方法 54
5.2.2實驗的結果 58
5.3 韻律訊息 73
5.3.1實驗的方法 73
5.4語音合成與聽覺測試 75
5.4.1 語音合成 75
5.4.2 聽覺測試與多音字聽覺測試 77
第六章 結論 79
參考文獻 81
附錄. 86



1.鍾榮富,“台灣客家語音導論”,五南圖書出版股份有限公司,2004。
2.龔萬灶,“客話實用手冊”,龔萬灶,2007。
3.“客語能力認證基本詞彙–初級(四縣腔)”,行政院客家委員會,2009。
4.“客語能力認證基本詞彙–中高級(四縣腔)”,行政院客家委員會,2009。
5.客語能力認證基本詞彙–初級(海陸腔)”,行政院客家委員會,2009。
6.林東逸,“客語文句翻語音系統之實作”,交通大學電信工程學系碩士論文,2006。
7.吳俊毅,“線上客語語音合成系統中產生韻律訊息之研究”,中興大學資訊科學與工程學系研究所碩士論文,2010。
8.黃豐隆,“線上國客雙語有聲詞典建置之研究”,全國計算機會議(NCS-2009),台北,台灣,2009。
9.黃豐隆,“線上語音合成系統之研製與應用,”全國電信研討會 (NST-2008),雲林,台灣, 2008。
10.潘能煌,“中文文轉音系統的韻律預估及其改進”,國立中興大學應用數學系博士論文, 2004。
11.蔡育和,“中文文轉音系統中韻律階層的求取”,中興大學資訊科學學系碩士論文,2005。
12.林金玉, “中文轉台語文轉音系統中一詞多音之預測”, 國立中興大學資訊科學與工程學系研究所碩士論文, 2008。
13.台文/華文線頂辭典http://203.64.42.21/iug/Ungian/soannteng/chil/Taihoa.asp
14.行政院客委會 客語能力認證網站http://api1.game.hakka.gov.tw/hkaword.php
15.臺灣客家語拼音方案http://www.edu.tw/mandr/bulletin.aspx?bulletin_sn=3824
16.臺灣客家語常用詞詞典網路版 http://hakka.dict.edu.tw/
17.臺灣話語音漢字辭典及外語辭典http://www.edutech.org.tw/DICT/All-Dictionaries.htm
18.聯合大學線上國客語有聲詞典http://203.64.183.226/public2/hakka-edu/hakka-index.htm
19.賴亦傑,“應用多詞及多詞性語言模型的中文斷詞及詞性標記方法”,中興大學資訊科學與工程學系碩士論文,2011。
20.張子榮、 初敏, “解決多音詞字-音轉換的一種統計學習方法”, 中文信息學報, 2002, 第3期, pp.39-45.
21.蔡文鴻, “語言模型訓練與調適技術於中文大詞彙連續語音辨識之初步研究”,國立臺灣師範大學資訊工程研究所碩士論文,2005。
22.廖振淵, “利用粗糙集理論解決中文轉台語文轉音系統中一詞多音問題”,中興大學資訊科學與工程學系研究所碩士論文,2010。
23.中研院中文詞知識庫小組http://godel.iis.sinica.edu.tw/CKIP/treebank.htm
24.李雪貞,“客語語音合成之初步研究”,台灣科技大學資訊工程系研究所碩士論文,2002。
25.蔡昀庭,“基於隱藏式馬可夫模型之中文語音合成系統”,國立清華大學電機工程研究所碩士論文,2007。
26.高瑜璟,“數位學習-學習的新趨勢”,高師大資訊教育研究所。http://www.nhu.edu.tw/~society/e-j/57/57-22.htm
27.Jiawei Han and Micheline Kamber, "Data Mining Concepts and Techniques", Morgan Kaufmann publishers, 1999.
28.Min Chu, Hu Peng, Hong-yun Yang and E.Chang, " Selecting Non-Uniform Units from A Very Large Corpus for Concatenative Speech Synthesizer ", Proceedings of ICASSP 2001, IEEE, Volume 2, pp.785 - 788, Salt Lake City.
29.Classification and Regression Trees (C&RT),http://www.statsoft.com/textbook/classification-and-regression-trees/
30.Quinlan, J. R. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993.
31.Frederick Jelinek, "Statistical Methods for Speech Recognition " ,The MIT Press, Cambridge Massachusetts, 1997.
32.Corinna Cortes and V. Vapnik, "Support-Vector Networks", Machine Learning, 20, 1995. http://www.springerlink.com/content/k238jx04hm87j80g/
33.David Graff and Ke Chen “Chinese Gigaword”, Linguistic Data Consortium (LDC) catalog number LDC2007T03 and isbn 1-58563-409-3. http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2007T38
34.S. Kotsiantis, "Supervised Machine Learning: A Review of Classification Techniques", Informatica Journal 31, 2007, 249-268.
35.Keh-Jiann Chen and Shing-Huan Liu, "Word Identification For Mandarin Chinese Sentences", Proceeding COLING ''92 Proceedings of the 14th conference on Computational linguistics 1992, Vol. 1, pp.101-107.
36.Andi Wu, Zixin Jiang, "Word Segmentation In Sentence Analysis", International Conference on Chinese Information Processing in Beijing China 1998, pp.169-180.


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔