跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.134) 您好!臺灣時間:2025/12/22 05:09
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:許文龍
研究生(外文):Wen-Lung Hsu
論文名稱:使用時間比例基週波形內差之國語語音合成器
論文名稱(外文):A Mandarin Speech Synthesizer Using Time Proportionated Interpolation of Pitch Waveform
指導教授:古鴻炎古鴻炎引用關係
指導教授(外文):Hung-Yan Gu
學位類別:碩士
校院名稱:國立臺灣科技大學
系所名稱:電機工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1996
畢業學年度:84
語文別:中文
論文頁數:57
中文關鍵詞:文句翻語音系統基週波型時間比例內差法基週軌跡共振幅峰聲道
外文關鍵詞:a text-to-speech systempitch contourformant frequency
相關次數:
  • 被引用被引用:2
  • 點閱點閱:217
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文所製作的文句翻語音系統是在Ms-Windows作業系統上發展,主要是
以408個第一聲國語音節做為音節信號之合成單元。在信號產生方面,我
們提出一種時域上的作法,稱為基週波形時間比例內差法(TPIPW)的技術
。在訊律訊息方面,主要是以前人提出的韻律規則為基礎,再作部份修改
。在音節信號合成方面,我們分成無聲部分(如無聲子音)與有聲部分 (含
有聲鼻音、滑音、流音、母音)兩部分分別做合成處理。所提出的技術,
其名稱是指有聲部份的處理方法。利用此方法我們可以幾乎獨立地去改變
所合成音節的音調(基週軌跡)、音長、及共振峰頻率全體的展縮,較特別
的是,音長的調整幅度比其他技術大很多,如從原來音長的1/2到2倍以上
而不會影響其他控制因素,此外,提供對頻率軸作展縮處理,用以模擬聲
道之加長或減短,可使得用原始男生聲音合成出的女生聲音較自然許多。
關於無聲部分,我們根據信號特性將無聲部分分為二類,並提出一個可行
的方法,使合成出的無聲部分清晰可分辨,且可控制其時間長度。
In this thesis, a text-to-speech system is designed and
implemented on MS-Windows operating system. The 408 first-tone
Mandarin syllables are adopted as the synthesis units. For the
synthesis of syllable-signal, a time-domain processing method
called "Time Proportionated Interpolation of Pitch Waveform
(TPIPW)" is proposed. About the prosodic processing unit, a
rule-based method proposed by other researchers is adopted and
slightly modified here. In our method, the two parts of a
syllable, i.e. the unvoiced part (e.g. voiceless consonants)
and voiced parts (e.g. voiced consonants and vowels), are
processed separately. The name of our method is just selected
to reflect the voiced-part''s processing. By using this method,
a syllable''s tone(or pitch-contour), duration, and formant-
frequency height can be almost independently controlled.
Especially, the duration of a syllable can be more freely
changed to a value between one half and double of the original
length without notable side-effects on the other two control
factors. Besides, the function of increasing or decreasing
formant-frequency values is provided to simulate the adjusting
of vocal-track length such that the original recorded male
voice can be more naturally converted to a female''s voice. For
the unvoiced part, signal waveforms are classified into two
classes and a method is proposed to process each class
differently. This method not only synthesizes clear and
intelligible signals but also support the control of duration.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top