臺灣博碩士論文加值系統

English |FB 專頁 |Mobile

免費會員登入| 註冊

功能切換導覽列

(216.73.216.106) 您好！臺灣時間：2026/04/02 06:39

字體大小：

:::

詳目顯示

第 1 筆 / 共 1 筆

/1頁

論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
QR Code

本論文永久網址:

研究生:

黃競億

研究生(外文):

Jing-Yi Huang

論文名稱:

台語TTS變調規則與斷詞器之製作

論文名稱(外文):

Implementation of Tone Sandhi Rules and Tagger for Taiwanese TTS

指導教授:

陳信宏

指導教授(外文):

Sin-Horng Chen

學位類別:

碩士

校院名稱:

國立交通大學

系所名稱:

電信工程系

學門:

工程學門

學類:

電資工程學類

論文種類:

學術論文

論文出版年:

2001

畢業學年度:

語文別:

中文

論文頁數:

中文關鍵詞:

語音合成、台語、變調規則

外文關鍵詞:

speech synthesis、Taiwanese、Tone Sandhi Rule

相關次數:

被引用:7
點閱:647
評分:
下載:36
書目收藏:7

在本論文中，我們在台語TTS系統中引進了變調的觀念，處理先前研究中所未考慮到的變調規則，以及詞性的觀念，應用於TTS系統中的韻律訊息產生器與文句分析部分，讓語音合成的的效果可以更自然流利。我們並針對台語詞庫作改進，希望對語音合成系統對文章的斷詞結果可以有較佳的結果，以改善語音合成的品質。我們並使用統計方法來製作一個台語的短詞合成系統。

In this thesis, based on a Min-Nan speech TTS system proposed in previous study, some modifications were done to improve the quality of synthesized speech. The original Min-Nan speech TTS system contained three parts- text-parser, prosodic information generator and PSOLA synthesizer. It is well known that the tone sandhi will change the tones of most speech from the lexicon tone in Min-Nan. In order to get better pitch contour of synthesis speech, a unit is added after parser to change the tone information generated from parser according to the tone sandhi rules of Min-Nan. The POS(part of speech) is also added in the lexicon of parser to get more information in text and a better performance of prosodic information generation unit was achieved. Finally, in order to improve the performance of short word, a statistical prosodic information generating scheme is built for a word synthesizer.

目錄I
表目錄III
圖目錄IV
第一章緒論1
1.1 研究動機1
1.2 國語文句翻語音系統簡要說明1
1.3 研究方向2
第二章台語文句翻語音系統的應用原理3
2.1 台語的特性4
2.2 韻律訊息產生器4
2.2.1 遞迴式類神經網路4
2.3 基頻同步疊加（PSOLA）合成方法7
2.3.1 基頻同步分析7
2.3.2 基頻同步變換8
2.3.3 基頻同步疊加合成9
2.3.4 時長變化10
2.3.5 音高變化11
第三章台語變調規則與詞性13
3.1台語基本特性13
3.1.1 台語的語文特性13
3.2台語變調14
3.2.1 台語變調規則14
3.2.2 特別變調規則--『仔』前再變調16
3.2.3 台語變調規則應用於RNN類神經網路17
3.3 詞類（PART OF SPEECH, POS）18
3.3.1 RNN類神經網路加入POS18
第四章台語文句翻語音系統之實作20
4.1 基本聲學參數抽取20
4.2變調規則與詞類應用於RNN之實驗21
4.3系統流程26
4.3.1文句分析單元27
4.3.1詞庫的改進28
4.3.1語音波形樣本資料庫31
第五章短詞合成的原理與實做32
5.1前言32
5.1.1音節長度Duration32
5.1.2能量軌跡(Energy Contour)35
5.1.3基頻軌跡(Pitch Contour)38
5.1.4停頓音長(Pause Duration)38
5.2實驗結果39
5.2.1音節長度Duration40
5.2.2音節能量軌跡與基頻軌跡41
5.2.3停頓音長(Pause Duration)41
5.2.4結果測試43
第六章結論與未來展望44
參考文獻46
附錄48
表目錄
表3.1 台語八聲例表13
表3.2 台語詞類表19
表4.1 停頓長度之分類21
表4.2 韻母之結構22
表4.3 使用方法一之韻律合成實驗結果23
表4.4 使用方法二之韻律合成實驗結果23
表5.1 INITIAL TYPE34
表5.2 FINAL TYPE34
表5.3 NASAL TYPE34
表5.4 聲母分類37
表5.5 入聲分類38
表5.6 數量統計39
表5.7 位置伸縮係數40
表5.8 聲調伸縮係數40
表5.9 音節型態伸縮係數40
表5.10 二字詞停頓音長統計41
表5.11 多字詞停頓音長統計42
表5.12 結果測試43
圖目錄
圖2.1 台文句翻語音系統架構3
圖2.2 人腦產生韻律資訊的概念模型5
圖2.3 細分之韻律產生模型6
圖2.4 遞迴類神經網路方塊圖6
圖2.5 以基頻同步疊加法改變音高( )11
圖2.6 以基頻同步疊加法改變音高( )12
圖3.1 台語聲調的基頻軌跡14
圖3.2 台語聲調變調規則圖15
圖3.3 應用變調規則於類神經網路17
圖4.1 韻律信息合成實例25
圖4.2 台語文句翻語音系統流程圖26
圖4.3 文句分析方塊圖27
圖4.4 詞庫整理程式30
圖5.1 語音分段圖35

參考文獻
[1]C. Mitchell, M. Harper, L. Jamieson & R. Helzermam (1995), “A parallel implementation of a hidden Markov model with duration modeling for speech recognition, ” Digital Signal Proc. 5, pp.43-57
[2]X. Huang, H. Hon, M. Hwang & K. Lee (1993), “A comparative study of discrete, semicontinuous, and continuous hidden Markov models,” Computer, Speech & Lang. 7, pp.359-368.
[3]S. Levinson (1986), “Continuously variable duration hidden Markov models for speech analysis,” Proc. IEEE ICASSP, pp. 1241-1244
[4]D. H. Klatt (1987), “Review of text-to-speech conversion for English,” J. Acoust. Soc. Amer. 82, pp.137-181.
[5]S. H. Chen, S. H. Hwang and Y. R. Wang (1998), “An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol. 6, no.3, pp.226-239.
[6]S. H. Chen, and S. H. Hwang, and Y. R. Wang,” An RNN-based prosodic information synthesizer for Mandarin text-to-speech,” IEEE Trans. Speech and Audio Processing, vol.6, no.3, pp.226-239, May 1998.
[7]E. Moulines, and F. Charpentier, “Pitch-synchronous waveform processing technique for text-to-speech synthesis using diphones,” Speech Communication 9, pp.453-467, 1990.
[8]C. Hamon, E. Moulines, and F. Charpentier, “A diphone synthesis system based on time-domain prosodic modification of speech”, in Proc. Int. Conf. Acoust., Speech, Signal Proc., pp.238-241, 1989.
[9]S. H. Chen, and Y. R. Wang, “Vector quantization of pitch information in Mandarin Speech,” IEEE Trans. Communication, vol.38, no.9, pp.1317-1320, Sep. 1990.
[10]黃紹華，”中文文句翻語音系統中韻律訊息產生器之研究”，國立交通大學博士論文，民國八十五年六月。
[11]鄭良偉，”精速台語羅馬字練習與規律”，旺文社股份有限公司，1993年4月。
[12]何鎮仲，”混合統計與類神經網路法之台語韻律合成”，國立交通大學碩士論文，2000年六月。
[13]鄭良偉，”台語的語音與詞法”，遠流出版社，1997年。

電子全文

國圖紙本論文

推文
網路書籤
推薦
評分
引用網址
轉寄

top

相關論文
相關期刊
熱門點閱論文

1.	中文文句翻語音系統中韻律訊息產生器之研究
2.	台語TTS系統之改進
3.	以華台雙語資訊及韻律調整為改進之台語文字轉語音系統
4.	混合統計與類神經網路之台語韻律合成
5.	基於HTK連續語音辨識的台語朗讀語音資料庫之自動標音
6.	台語斷詞器之改進
7.	利用混合式分群基因演算法解決台語文轉音系統中一詞多音的問題
8.	語音合成中韻律訊息產生及基頻同步疊加合成之研究
9.	基於自動產生合成單元之台語語音合成系統
10.	台灣多語語音資料庫之建立及應用
11.	九官鳥：國臺語機器翻譯及語音合成發展系統
12.	台語語音合成技術之研究

無相關期刊

1.	台語TTS系統之改進
2.	使用前後文相關HMM模型之國語連續語音辨認
3.	以最大似然機率線性回歸法建立線上層級體系語者調適語音辨認
4.	語言辨識與檢索在中文口語處理之研究
5.	中文口述語言處理之進一步技術
6.	軟體無線電之研究:寬頻分碼多重進接空-時犁耙接收器之DSP實現
7.	利用多階線性估測作分數取樣盲式等化
8.	使用類神經網路機制產生中英文夾雜文句之韻律訊息
9.	服務品質保證路由技術及其性能評估
10.	擴充相關LMS之迴音消除
11.	高性能可變長度封包匹配演算法
12.	基於二維犁耙器接收機架構在寬頻分碼多重進接系統方面應用之研究
13.	使用統計模式之基頻軌跡偵測器
14.	全數位化多使用者之分碼多工接收機及其ASIC設計
15.	互補式金氧半導體壓控石英振盪器之設計與分析

簡易查詢 | 進階查詢 | 熱門排行 | 我的研究室