跳到主要內容

臺灣博碩士論文加值系統

(3.87.250.158) 您好!臺灣時間:2022/01/25 18:41
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:魯弘茂
研究生(外文):Hong-Mao Lu
論文名稱:中文語音合成技術之實作與分析
論文名稱(外文):An Implementation and Analysis of Mandarin Speech Synthesis Technologies
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horng Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:58
中文關鍵詞:語音合成文句翻語音系統基頻同步疊加遞迴式類神經網路
外文關鍵詞:speech synthesisTTSText To SpeechPSOLARNN
相關次數:
  • 被引用被引用:7
  • 點閱點閱:749
  • 評分評分:
  • 下載下載:99
  • 收藏至我的研究室書目清單書目收藏:1
本論文對國立交通大學電信研究所過去發展的國語文句翻語音系統提出一些改進。首先,對於由411個基本音節波型過長所引起的合成聲音品質不佳的效應加以改進,採用由連續語音中抽取長度適中且沒有連音效應的基本音節波型以及去除過長的基本音節波型的鼻音部分,可大幅度改善合成聲音品質;接著,我們比較TD-PSOLA的三種不同能量補償方式─簡單重疊相加、最小平均方相加、及簡化後的簡單重疊相加,以及LP-PSOLA,最後決定採用簡化後的簡單重疊相加方式的TD-PSOLA;然後,我們使用類神經網路來產生音節的能量軌跡,將音節依照聲母分成四大類,個別使用一個MLP,由適當的語言輸入參數,可產生相當好的能量軌跡;最後,我們改進過去所提出,以 RNN-MLP方式,對夾雜在中文文句中的英文專有名詞,產生逐字發音所需的韻律信息,獲得較佳的字母長度及中英文詞間停頓長度。
In this thesis, some approaches to improve the Mandarin TTS system, developed previously in the Department of Communication Engineering of National Chiao Tung University, are discussed. Firstly, the problem of the acoustic inventory comprising too-long waveforms of 411 isolated base-syllables is solved by selecting waveforms of proper duration from continuous speech and by compressing the nasal parts of too-long waveforms. Experimental results showed that the quality of the synthesized speech was greatly improved. Secondly, three forms of TD-PSOLA and LP-PSOLA are implemented to compare their qualities. Based on the study, we choose to use the simplest form of TD-PSOLA. Thirdly, an NN-based method is proposed to generate the energy contour of syllable. We first classify all syllables into four classes according to their initials, and then use one MLP to generate energy contours for syllables in each class. With properly choosing input linguistic features, very good synthesized energy contour of syllable can be obtained. Lastly, the RNN-MLP method proposed previously for the generation of prosodic parameters for English alphabets embedded in Chinese text is refined. Experimental results showed that better alphabet duration and pause durations before and after English words were obtained.
中文摘要
英文摘要
誌謝
目錄
表目錄
圖目錄
第一章 緒論
1.1 研究動機
1.2 中文文句翻語音系統概述
1.3 章節概要說明
第二章 應用原理
2.1 國語語音特性
2.2 馬可夫語言模型
2.2.1 詞類分類法
2.3 韻律訊息產生器
2.3.1 遞迴式類神經網路韻律產生器
2.3.2 多層式類神經網路
2.4 基頻同步疊加(PSOLA)合成方法
2.4.1 基頻同步分析
2.4.2 基頻同步變換
2.4.3 基頻同步疊加合成
2.4.4 時長變化
2.4.5 音高變化
第三章 語音合成技術實作及分析
3.1 合成器女性語者樣本音節選取
3.2 不同方式的TD-PSOLA合成方法之實作
3.3 LP-PSOLA合成方法之實作
3.3.1 樣本音節LPC係數及LPC residual求取
3.3.2 Residual信號合成及波形還原
3.3.3 LP-PSOLA的合成品質
第四章 能量曲線類神經網路
4.1以相對對數能量來描述音節能量曲線
4.2能量曲線類神經網路及構架
4.3類神網路訓練資料與目標值的正規化動作
4.4合成音節能量修正
4.4.1合成器中的樣本音節能量曲線求取
4.4.2在語音合成器中調整樣本音節的能量
4.4.2.1音節無韻律部份能量調整
4.4.2.2音節韻律部份能量調整
4.5能量曲線類神經網路的訓練結果與分析
4.5.1語料介紹
4.5.2類神經網路訓練結果與分析
4.5.3音節能量曲線與合成語音之品質
第五章 英文字母逐字發音之效能改進
5.1 英文逐字發音RNN-MLP機制
5.2 實驗結果與分析
5.2.1對照組
5.2.2 RNN-MLP機制實驗結果與分析
第六章 結論與展望
6.1 結論
6.2 未來展望
參考文獻
附錄一
附錄二
[1] S.H. Hwang, S.H. Chen, and Y.R. Wang, "A Mandarin Text-to-Speech system," in Proc. ICSLP-96, pp.1421-1424, Oct.1996.
[2] E. Moulines, and F. Charpentier, "Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones," Speech Communication 9, pp.453-467, 1990.
[3] F. Charpentier and Moulines, "Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones," European Conf. On Speech Communication and Technology, pp.13-19, Paris, 1989.
[4] S. H. Chen, and S. H. Hwang, and Y. R. Wang, "An RNN-based prosodic information synthesizer for Mandarin Text-to-Speech," IEEE Trans. Speech and Audio Processing, vol.6, no.3, pp.226-239, May 1998.
[5] A. Bonafonte, I. Esquerra, A. Febrer and F. Vallverdu, Bilingual Text-to-Speech System in Spanish and Catalan," in the proc. of Eurospeech97, pp.2455-2458, Rhodes, Greece, 1997.
[6] S. Haykin, “Neural Networks - A Comprehensive Foundation,” Macmillan College Publishing Company, 1994.
[7] 黃紹華,"中文文句翻語音系統中韻律訊息產生器之研究",國立交通大學博士論文,民國八十五年六月。
[8] 「中央研究院平衡語料庫的內容與說明」,中央研究院資訊科學研究所中文詞知識庫小組,民國八十四年九月。
[9] 盧鵬任,"中文文句翻語音系統之改進",國立交通大學碩士論文,民國八十六年六月。
[10] 陳啟仁,"使用類神經網路機制產生中英文夾雜文句之韻律訊息",國立交通大學碩士論文,民國九十年六月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊