資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽
|
首頁
|
關於本站
|
聯絡我們
|
國圖首頁
|
常見問題
|
操作說明
English
|
FB 專頁
|
Mobile
免費會員
登入
|
註冊
切換版面粉紅色
切換版面綠色
切換版面橘色
切換版面淡藍色
切換版面黃色
切換版面藍色
功能切換導覽列
(18.97.14.90) 您好!臺灣時間:2025/01/21 19:03
字體大小:
字級大小SCRIPT,如您的瀏覽器不支援,IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,如為IE7或Firefoxy瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
字體大小變更功能,需開啟瀏覽器的JAVASCRIPT功能
:::
詳目顯示
recordfocus
第 1 筆 / 共 1 筆
/1
頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
QR Code
本論文永久網址
:
複製永久網址
Twitter
研究生:
黃崇岳
研究生(外文):
Chung-Yueh Huang
論文名稱:
中文文轉音系統之語音合成模組的改良
論文名稱(外文):
Improving the Speech Synthesis Module in a Mandarin TTS System
指導教授:
余明興
、
潘能煌
指導教授(外文):
Ming-Shing Yu
、
Neng-Huang Pan
口試委員:
古鴻炎
口試委員(外文):
Hung-Yan Gu
口試日期:
2016-07-28
學位類別:
碩士
校院名稱:
國立中興大學
系所名稱:
資訊科學與工程學系
學門:
工程學門
學類:
電資工程學類
論文種類:
學術論文
論文出版年:
2016
畢業學年度:
104
語文別:
中文
論文頁數:
50
中文關鍵詞:
文轉音系統
、
語音合成
、
韻律訊息
外文關鍵詞:
Text-to-Speech
、
Speech Synthesis
、
Prosodic Cues
相關次數:
被引用:0
點閱:374
評分:
下載:21
書目收藏:0
本論文主要在探討中文文轉音系統中語音合成模組的改良。藉由韻律架構的定義、語料庫的建置、連音的處理、合成單元的韻律調整等方式,期望得到自然流暢的合成語音。
我們定義了一個三段式架構,用來表示語音的音長、音高、音量等韻律訊息。除了單音之外,我們將連續語音加入語料庫中。帶有連音的語音作為合成單元,可以擴充語料庫,也增加合成語音時,選擇合成單元的彈性。我們提出的三段式架構同時可適用於單音及連續音的韻律訊息的描述。
韻律調整的部分,我們嘗試在聲音訊號的時域上調整。以基週為單位,使用類似於基週同步疊加法的方式來改造合成單元,希望降低合成的複雜度之外,也能獲得不錯的聲音品質。
最後,我們從真人錄製的語音中抽取韻律參數,使用本論文實作出的語音合成模組得到合成句。我們進行了可辨度和自然度的實驗,用來度量語音合成模組的結果。結果顯示,本論文提出的語音合成模組實作方式對比於先前研究的實作方式有較佳的效果。
This thesis aims to implement a speech synthesis module in a Mandarin text-to-speech (TTS) system. By defining the prosodic structure, building the corpus, processing coarticulations, and adjusting synthesis
units, we expect to get natural and fluent synthesis speech.
We define a three-stage structure to represent duration, pitch, and volume of the voice. In addition to individual syllables, we take continuous words from speeches into our corpus. We use voices with coarticulation to extend our corpus and to improve the flexibility of deciding synthesis units. The three-stage structure we proposed is applicable to both individual
voices and continuous voices.
For the adjustment of duration, pitch, and volume, we modify the synthesis units in time domain. We reform the wave form of synthesis units on the basis of “Pitch Synchronous Overlap and Add” (PSOLA), expecting to reduce the computational complexity and to get a decent
result.
Finally, we generate sentences through the speech synthesis module with prosodic cues extracted from actual human speech for experiment. Two experiments are designed with intelligibility and quality to evaluate our speech synthesis module. As a result, the performance of our speech synthesis module compares more favorably with that of earlier studies.
致謝 i
摘要 ii
Abstract iii
目錄 iv
圖目錄 vi
表目錄 vii
第一章 緒論 1
1.1 研究動機與目的 1
1.2 語音合成技術研究回顧 2
1.3 研究方法 4
1.4 章節介紹 6
第二章 語料架構 7
2.1 背景知識 7
2.1.1 pitch mark 7
2.1.2 PSOLA 8
2.1.3 連音現象 10
2.2 韻律參數及分段架構 11
2.2.1 韻律參數 11
2.2.2 三段式架構 12
2.3 語料實例 14
2.3.1 單音 15
2.3.2 連續音 16
第三章 語音合成模組實作 17
3.1 工作流程 17
3.2 合成單元選取 19
3.3 連音再造 22
3.4 音長調整 27
3.5 音高調整 29
3.6 音量調整 32
第四章 聽測實驗與結果 33
4.1 實驗介紹 33
4.2 可辨度 35
4.3 自然度 38
第五章 結論 41
參考文獻 42
附錄 44
[1]John R. Deller, John G. Proakis, and John H. L. Hansen, "Discrete-Time Processing of Speech Signals", Macmillan Publishing Company, 1993.
[2]Lawrence R. Rabiner and Ronald W. Schafer, "Theory and Applications of Digital Speech Processing", Pearson Education Inc., 2010.
[3]Olufemi Sunday Adeoye, "A Survey of Emerging Biometric Technologies." International Journal of Computer Applications (0975-8887), Volume 9-No.10, 2010.
[4]Joao P. Cabral and Luis C. Oliveira, "Pitch-Synchronous Time-Scaling for Prosodic and Voice Quality Transformations", Interspeech, pp. 1137-1140, 2005.
[5]陳黃威,"改善豐富文脈模型於中文語音合成之研究",國立臺灣師範大學資訊工程研究所碩士論文 (2012)
[6]蔡昀庭,"基於隱藏式馬可夫模型之中文語音合成系統",國立清華大學電機工程研究所碩士論文 (2009)
[7]蔡依玲,"基於隱藏式馬可夫模型之客語文句轉語音系統",國立交通大學電信工程研究所碩士論文 (2010)
[8]李函軒,"基於隱藏式半馬可夫模型之中文文句轉語音系統及其模型調適與聲音轉換",國立清華大學電機工程研究所碩士論文 (2013)
[9]陳志祥,"國語連續語音連音型態之初步研究",國立國立中興大學應用數學研究所碩士論文 (1995)
[10]施善舒,"中文文轉音系統中由單音產生連續音之處理",國立國立中興大學資訊科學與工程研究所碩士論文 (2013)
[11]張唐瑜,"以大量詞彙作為合成單元的中文文轉音系統",國立國立中興大學資訊科學研究所碩士論文 (2005)
[12]林尚毅,"基於頻譜改造之中文語音合成",國立國立中興大學資訊網路與多媒體研究所碩士論文 (2012)
電子全文
國圖紙本論文
推文
當script無法執行時可按︰
推文
網路書籤
當script無法執行時可按︰
網路書籤
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
相關期刊
熱門點閱論文
1.
以大量詞彙作為合成單元的中文文轉音系統
2.
基於隱藏式馬可夫模型之客語文句轉語音系統
3.
基於隱藏式馬可夫模型之中文語音合成系統
4.
國語連續語音連音型態之初步研究
5.
中文文轉音系統中由單音產生連續音之處理
6.
基於頻譜改造之中文語音合成
7.
改善豐富文脈模型於中文語音合成之研究
8.
基於隱藏式半馬可夫模型之中文文句轉語音系統及其模型調適與聲音轉換
9.
以語料庫為基礎之新一代中文文句翻語音合成技術
10.
台灣多語語音資料庫之建立及應用
11.
嵌入式作業系統之中英夾雜文字轉語音系統建立流程研究
12.
具語者調適能力之中文單詞學習系統
13.
日語多媒體電子書-使用語音合成
14.
基於特徵替換法對語者調適語音合成之改進
15.
發展一套觸控式中文語音學習系統
無相關期刊
1.
華台語文轉音系統中未知詞發音決策
2.
中文轉客文語音合成系統中的文句分析模組之研究
3.
利用同義詞和剖析樹改善台語多音詞發音預測之準確率
4.
語音合成及語者轉換之應用與設計
5.
醫療社團法人公司化與治理之研究
6.
中文文轉音系統中由單音產生連續音之處理
7.
銀行對中小企業授信評估之研究—以國內某銀行為例
8.
運用創新策展之商業模式探討:以視覺藝術個案研究
9.
雪山臺灣冷杉亞高山林孔隙動態與地被植群生態學之研究
10.
固定碳定價機制之理論與實務研究
11.
鹼性陰離子薄膜燃料電池的觸媒擔體研究
12.
應用手機通訊軟體LINE於數學課後輔導之學習成效研究分析
13.
食足世平:臺灣速食麵文化與社會變遷―以聯合知識庫為中心的討論(1967-2015)
14.
地產業的多角化經營及轉型
15.
鄉村旅遊吸引力、體驗行銷與體驗價值之研究—以苗栗農村再生社區為例
簡易查詢
|
進階查詢
|
熱門排行
|
我的研究室