跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.106) 您好!臺灣時間:2026/04/02 06:39
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:黃競億
研究生(外文):Jing-Yi Huang
論文名稱:台語TTS變調規則與斷詞器之製作
論文名稱(外文):Implementation of Tone Sandhi Rules and Tagger for Taiwanese TTS
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horng Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2001
畢業學年度:89
語文別:中文
論文頁數:51
中文關鍵詞:語音合成台語變調規則
外文關鍵詞:speech synthesisTaiwaneseTone Sandhi Rule
相關次數:
  • 被引用被引用:7
  • 點閱點閱:647
  • 評分評分:
  • 下載下載:36
  • 收藏至我的研究室書目清單書目收藏:7
在本論文中,我們在台語TTS系統中引進了變調的觀念,處理先前研究中所未考慮到的變調規則,以及詞性的觀念,應用於TTS系統中的韻律訊息產生器與文句分析部分,讓語音合成的的效果可以更自然流利。我們並針對台語詞庫作改進,希望對語音合成系統對文章的斷詞結果可以有較佳的結果,以改善語音合成的品質。我們並使用統計方法來製作一個台語的短詞合成系統。
In this thesis, based on a Min-Nan speech TTS system proposed in previous study, some modifications were done to improve the quality of synthesized speech. The original Min-Nan speech TTS system contained three parts- text-parser, prosodic information generator and PSOLA synthesizer. It is well known that the tone sandhi will change the tones of most speech from the lexicon tone in Min-Nan. In order to get better pitch contour of synthesis speech, a unit is added after parser to change the tone information generated from parser according to the tone sandhi rules of Min-Nan. The POS(part of speech) is also added in the lexicon of parser to get more information in text and a better performance of prosodic information generation unit was achieved. Finally, in order to improve the performance of short word, a statistical prosodic information generating scheme is built for a word synthesizer.
目錄I
表目錄III
圖目錄IV
第一章 緒論1
1.1 研究動機1
1.2 國語文句翻語音系統簡要說明1
1.3 研究方向2
第二章 台語文句翻語音系統的應用原理3
2.1 台語的特性4
2.2 韻律訊息產生器4
2.2.1 遞迴式類神經網路4
2.3 基頻同步疊加(PSOLA)合成方法7
2.3.1 基頻同步分析7
2.3.2 基頻同步變換8
2.3.3 基頻同步疊加合成9
2.3.4 時長變化10
2.3.5 音高變化11
第三章 台語變調規則與詞性13
3.1台語基本特性13
3.1.1 台語的語文特性13
3.2台語變調14
3.2.1 台語變調規則14
3.2.2 特別變調規則--『仔』前再變調16
3.2.3 台語變調規則應用於RNN類神經網路17
3.3 詞類(PART OF SPEECH, POS)18
3.3.1 RNN類神經網路加入POS18
第四章 台語文句翻語音系統之實作20
4.1 基本聲學參數抽取20
4.2變調規則與詞類應用於RNN之實驗21
4.3系統流程26
4.3.1文句分析單元27
4.3.1詞庫的改進28
4.3.1語音波形樣本資料庫31
第五章 短詞合成的原理與實做32
5.1前言32
5.1.1音節長度Duration32
5.1.2能量軌跡(Energy Contour)35
5.1.3基頻軌跡(Pitch Contour)38
5.1.4停頓音長(Pause Duration)38
5.2實驗結果39
5.2.1音節長度Duration40
5.2.2音節能量軌跡與基頻軌跡41
5.2.3停頓音長(Pause Duration)41
5.2.4結果測試43
第六章結論與未來展望44
參考文獻46
附錄48
表目錄
表3.1 台語八聲例表13
表3.2 台語詞類表19
表4.1 停頓長度之分類21
表4.2 韻母之結構22
表4.3 使用方法一之韻律合成實驗結果23
表4.4 使用方法二之韻律合成實驗結果23
表5.1 INITIAL TYPE34
表5.2 FINAL TYPE34
表5.3 NASAL TYPE34
表5.4 聲母分類37
表5.5 入聲分類38
表5.6 數量統計39
表5.7 位置伸縮係數40
表5.8 聲調伸縮係數40
表5.9 音節型態伸縮係數40
表5.10 二字詞停頓音長統計41
表5.11 多字詞停頓音長統計42
表5.12 結果測試43
圖目錄
圖2.1 台文句翻語音系統架構3
圖2.2 人腦產生韻律資訊的概念模型5
圖2.3 細分之韻律產生模型6
圖2.4 遞迴類神經網路方塊圖6
圖2.5 以基頻同步疊加法改變音高( )11
圖2.6 以基頻同步疊加法改變音高( )12
圖3.1 台語聲調的基頻軌跡14
圖3.2 台語聲調變調規則圖15
圖3.3 應用變調規則於類神經網路17
圖4.1 韻律信息合成實例25
圖4.2 台語文句翻語音系統流程圖26
圖4.3 文句分析方塊圖27
圖4.4 詞庫整理程式30
圖5.1 語音分段圖35
參考文獻
[1]C. Mitchell, M. Harper, L. Jamieson & R. Helzermam (1995), “A parallel implementation of a hidden Markov model with duration modeling for speech recognition, ” Digital Signal Proc. 5, pp.43-57
[2]X. Huang, H. Hon, M. Hwang & K. Lee (1993), “A comparative study of discrete, semicontinuous, and continuous hidden Markov models,” Computer, Speech & Lang. 7, pp.359-368.
[3]S. Levinson (1986), “Continuously variable duration hidden Markov models for speech analysis,” Proc. IEEE ICASSP, pp. 1241-1244
[4]D. H. Klatt (1987), “Review of text-to-speech conversion for English,” J. Acoust. Soc. Amer. 82, pp.137-181.
[5]S. H. Chen, S. H. Hwang and Y. R. Wang (1998), “An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol. 6, no.3, pp.226-239.
[6]S. H. Chen, and S. H. Hwang, and Y. R. Wang,” An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol.6, no.3, pp.226-239, May 1998.
[7]E. Moulines, and F. Charpentier, “Pitch-synchronous waveform processing technique for text-to-speech synthesis using diphones,” Speech Communication 9, pp.453-467, 1990.
[8]C. Hamon, E. Moulines, and F. Charpentier, “A diphone synthesis system based on time-domain prosodic modification of speech”, in Proc. Int. Conf. Acoust., Speech, Signal Proc., pp.238-241, 1989.
[9]S. H. Chen, and Y. R. Wang, “Vector quantization of pitch information in Mandarin Speech,” IEEE Trans. Communication, vol.38, no.9, pp.1317-1320, Sep. 1990.
[10]黃紹華 ,”中文文句翻語音系統中韻律訊息產生器之研究”,國立交通大學博士論文,民國八十五年六月。
[11]鄭良偉,”精速台語羅馬字練習與規律”,旺文社股份有限公司,1993年4月。
[12]何鎮仲,”混合統計與類神經網路法之台語韻律合成”,國立交通大學碩士論文,2000年六月。
[13]鄭良偉,”台語的語音與詞法”,遠流出版社,1997年。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊