跳到主要內容

臺灣博碩士論文加值系統

(75.101.211.110) 您好!臺灣時間:2022/01/26 14:07
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:鐘祥睿
研究生(外文):Xiang-Rui Zhong
論文名稱:台語TTS系統之改進
論文名稱(外文):An Improvement on the Implementation of Taiwanese TTS System
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horng Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:50
中文關鍵詞:語音合成台語
外文關鍵詞:Speech SynthesisTaiwanese TTS
相關次數:
  • 被引用被引用:10
  • 點閱點閱:420
  • 評分評分:
  • 下載下載:36
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,我們對交通大學語音實驗室以前開發的台語文句翻語音系統做了如下的改進,首先,為了避免台文表示法紊亂所造成文句分析上的困難,建置了一個國語對照台文拼音的辭典,使得此系統具備了處理國語文章的『翻譯』能力;其次,為了兼顧系統日後的擴充性對斷詞規則作了改造,並加入數詞的構詞法則;接著,利用相關函數的方法求出訓練語料的基頻標記,藉著這些基頻標記抽取更準確、有效的韻律訊息,並重新改造RNN韻律訊息產生器之架構,調整輸入參數,以改進RNN韻律訊息產生器之訓練,產生更接近自然語音流暢的韻律訊息;最後,將上述的作法和之前的系統介面整合。
In this thesis, an improvement of the TTS system, developed previously in the Speech Processing Lab of NCTU, on the following aspects is presented. Firstly, a “Chinese-to-Taiwanese” lexicon is built to solve the out-of-vocabulary problem of text analysis using Taiwanese lexicons only. It also makes the system possess the capability of processing Chinese text. Secondly, several rules of constructing compound words are added. Thirdly, a correlation-based pitch mark detection is employed to provide more accurate pitch information for the training of the RNN prosody synthesizer. Fourthly, the structure of RNN prosody synthesizer is changed. It uses one RNN with different input features for the generation of each type of prosodic information. Lastly, a new prototype Taiwanese TTS system is implemented on the PC with Windows 98/NT.
目錄 I
表目錄 III
圖目錄 IV
第一章 緒論 1
1.1 研究動機 1
1.2 研究方向 2
1.3 章節概要 2
第二章 台語文句翻語音系統的架構及原理 3
2.1 文句分析 3
2.2 韻律訊息產生器 8
2.2.1 產生韻律訊息 8
2.2.2 遞迴式類神經網路 9
2.3 波形合成 10
2.3.1 波形分析 10
2.3.2 基頻信號序列變換 11
2.3.3 波形疊加合成 12
2.3.4 時長變化 13
2.3.5 音高變化 13
第三章 文句分析單元實做 15
3.1台文詞庫整理 15
3.2台華對譯詞庫製作 16
3.2.1 目的 16
3.2.2 已有資料 16
3.2.3 製作流程 17
3.3 輔助工具開發 19
3.4 斷詞規則 20
3.4.1 長詞優先法 20
3.4.2 中研院斷詞法 21
3.5 構詞規則 21
3.5.1 疊詞合併 21
3.5.2 數詞合併 22
第四章 韻律訊息產生器 24
4.1 韻律訊息分開訓練(METHOD I) 25
4.1.1韻律訊息目標參數求取 25
4.1.2類神經網路輸入參數 26
4.1.3音節分類 27
4.1.4目標值正規化 27
4.2訓練語料再整理 28
4.3更新語料再訓練(METHOD II) 30
4.3.1新資訊引入 30
4.3.2基頻軌跡訓練 31
4.3.3音長訓練 32
4.3.4能量訓練 32
4.3.5停頓音長訓練 33
4.4變調規則併入訓練 34
4.5訓練結果比較及圖形範例 34
4.5.1『基頻軌跡參數』訓練結果統計 34
4.5.2『音長』訓練結果統計 35
4.5.3『能量』訓練結果統計 36
4.5.4『停頓音長』訓練結果統計 36
4.5.5統計數據討論 37
4.5.6方法二圖形範例 38
第五章 波形合成器 42
5.1音節波形序列(WAVE TABLE)製作 42
5.2波形合成 42
第六章 結論與未來展望 45
參考文獻 47
附錄 49
[1] C. Mitchell, M. Harper, L. Jamieson & R. Helzermam (1995), “A parallel implementation of a hidden Markov model with duration modeling for speech recognition, ” Digital Signal Proc. 5, pp.43-57
[2] D. H. Klatt (1987), “Review of text-to-speech conversion for English,” J. Acoust. Soc. Amer. 82, pp.137-181.
[3] S. H. Chen, S. H. Hwang and Y. R. Wang (1998), “An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol. 6, no.3, pp.226-239.
[4] S. H. Chen, and S. H. Hwang, and Y. R. Wang,” An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol.6, no.3, pp.226-239, May 1998.
[5] James A. Freeman, and David M. Skapura, “Neural Networks, Algorithm, Applications and Programming Techniques”, Addison-Wesley, 1991.
[6] E. Moulines, and F. Charpentier, “Pitch-synchronous waveform processing technique for text-to-speech synthesis using diphones”, Speech Communication 9, pp.453-467, 1990.
[7] C. Hamon, E. Moulines, and F. Charpentier, “A diphone synthesis system based on time-domain prosodic modification of speech”, in Proc. Int. Conf. Acoust., Speech, Signal Proc., pp.238-241, 1989.
[8] S. H. Chen, and Y. R. Wang, “Vector quantization of pitch information in Mandarin Speech,” IEEE Trans. Communication, vol.38, no.9, pp.1317-1320, Sep. 1990.
[9] Keh-Jiann Chen, and Shing-Huan Liu, “Word identification for Mandarin Chinese sentences”, Proceedings COLING ’92, pp.101-105 Nantes, France, 1991.
[10] 黃紹華 ,”中文文句翻語音系統中韻律訊息產生器之研究”,國立交通大學博士論文,1994年六月。
[11] 何鎮仲,”混合統計與類神經網路法之台語韻律合成”,國立交通大學碩士論文,2000年六月。
[12] 黃競億,”台語TTS變調規則與斷詞器之製作”,國立交通大學碩士論文,2001年六月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top