跳到主要內容

臺灣博碩士論文加值系統

(35.153.100.128) 您好!臺灣時間:2022/01/19 03:33
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:曹登鈞
研究生(外文):Teng-Chun TSAO
論文名稱:利用統計方法之基週期偵測器與國語連續語音聲調辨認
論文名稱(外文):Statistical Pitch Detection and Tone Recognition in Mandarin Speech
指導教授:王逸如王逸如引用關係
指導教授(外文):Yih-Ru Wang
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:55
中文關鍵詞:基頻軌跡候選值有聲/無聲維特比搜尋多層式類神經網路線性回歸刪除型插入性
外文關鍵詞:pitch contourcandidatevoiced/unvoicedviterbi searchMLPlinear regressiondeletioninsertion
相關次數:
  • 被引用被引用:1
  • 點閱點閱:389
  • 評分評分:
  • 下載下載:78
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,我們提出一套藉由統計方式來求取語音基頻軌跡的方法,並將之應用於國語連續語音之聲調辨認器。首先,我們將基頻抽取的工作視為找尋一條最有可能之基頻軌跡,藉由適當的建立各種音框屬於有聲/無聲的機率模型,以及各音框間基頻值轉換的機率模式,我們可將基頻軌跡求取之問題轉換成為一個最佳相似度(Maximum Likelihood, ML)的問題。由實驗證明,上述方法所求取之基週軌跡較現有方法為佳。其次,我們使用多層式類神經網路(MLP)辨認器去對所求出基頻軌跡做國語聲調,可達到77%的辨認率。
In this thesis, we proposed a statistical method to find the more reliable pitch contour of continue Mandarin speech. After finding the pitch contour, a neural network based tone recognizer was used to find the tone recognition results.
First, the pitch contour abstraction task was treat as finding the most probable pitch contour in lots of candidates decided in auto-correlation method. By properly modeling the probability models of unvoiced/voiced of a frame, pitch transition probability models between frames/segments, the pitch detection can be change into a maximum likelihood (ML) problem. And, in the experiments, we can find the performance of the proposed statistical pitch detector will be better thane the pitch detection method in ESPS package. Finally, a multi-layer perceptron was used as a tone recognizer, 77% tone recognition rate was achieved.
第一章 緒論 1
1.1 研究動機 1
1.2 研究方向 1
1.3 章節概要 2
第二章 統計模式之基頻軌跡偵測器 3
2.1影響基週期求取的關鍵 3
2.2使用機率模式之U/V Classifier 4
2.2.1 訓練語料中U/V值之設定 5
2.2.2 特徵參數的選取 5
2.3 基頻軌跡特徵參數的建立 8
2.4 基頻區段間狀態的移轉 9
2.5 基頻值移轉機率模型的建立 11
2.5.1 相鄰基頻值移轉機率( )模型的建立 12
2.5.2 非聲音部分相關之基頻值移轉機率模型的建立 15
2.6 基頻區段間移轉機率 17
2.6.1 基頻區段的散佈狀況與基頻值移轉機率的定義 18
2.6.2 基頻值移轉機率的修正 21
2.6.3 機率模型的確立 23
2.7 基頻軌跡的搜尋與決定 24
第三章 中文連續語音聲調的辨認 28
3.1 國語聲調的特性 28
3.2 MLP聲調辨認器 29
3.3 基頻軌跡的前處理 31
3.4 聲調特徵參數的抽取 31
3.4.1 基頻軌跡的區段化 32
3.4.2 使用前後文相關之參數 33
3.5 MLP辨認器的訓練 34
3.6 MLP辨認器的辨認 35
第四章 實驗結果與分析 37
4.1 使用語料 37
4.2 實驗及結果 38
4.2.1 基頻軌跡段之刪除型錯誤與插入型錯誤比較 39
4.2.2 以音框為單位比較U/V判別效能 40
4.2.3 音節間基頻平均值的比較( ) 43
4.2.4 音框間基頻值的比較( ) 44
4.3統計式基週偵測器之重估計 45
4.4 機率模型之調整 48
4.5 連續語音聲調辨認之實驗 51
第五章 結論與展望 55
5.1 結論 55
5.2 未來之展望 55
參考文獻 56
【1】 Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of speech recognition”, Prentice Hall, 1993.
【2】 J.D. Markel. “The SIFT Algorithm for Fundamental Frequency Estimation,” IEEE Trans. On Audio and Electroacoustics. Vol.20, pp.367-377, Dec. 1972.
【3】 翁以晢,”使用統計模式之基頻軌跡偵測器”,國立交通大學碩士論文,民國九十年六月。
【4】 Yih-Ru Wang and I-Bin Liao, “An Overwiew of Mandarin-Speech Tone Recognition,” Journal of the Chinese Institute of Electrical Engineering, Vol.7, No.2, pp.145-155, 2000.
【5】 Sin-Horng Chen, Yih-Ru Wang, “Tone Recognition of Continuous Mandarin Speech Based on Neural Networks,” IEEE Trans. on Speech and Audio Processing, Vol.3, No2, pp.146-150, March 1995.
【6】 Thomas K. Jewell, “Computer Applications for Engineers”, John Wiley & Sons, 1991.
【7】 游山銳,”使用遞迴式類神經網路之語音辨識前處理”,國立交通大學碩士論文,民國八十九年六月。
【8】 L.S. Lee, C.Y. Tseng and M. Ouh-Young, “The Synthesis Rules in a Chinese Text-to-Speech System,” IEEE Trans. Acoust., Speech, Signal Processing, Vol.37, No.9, pp.1309-1320, Sep. 1998.
【9】 L.R. Rabiner, “On the use of Autocorrelation Analysis for Pitch Detection,” IEEE Trans. Acoust., Speech, Signal Processing, Vol.Assp-25, pp.24-33, Feb. 1977.
【10】 Hong Zhang, Taiyi Huang, Junshou Song, “A New Method of Fundamental Frequency Extraction in Frequency Domain,” ICSP ‘98, pp.690-693.
【11】 廖宜斌,”使用語音輸出入介面之網路即時新聞閱讀系統”,國立交通大學碩士論文,民國八十八年六月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 周文穎、劉寬鎔、林隆光、潘玟利、施永豐(2002) • 台北市兩所中學學生對近視狀況的了解之調查• 中華民國眼科醫學會雜誌,41(1),59-65。
2. 苗迺芳(1996) • 教育介入對學生視力保健知識、態度、行為的影響• 衛生教育雜誌,16,20-31。
3. 林思源、何子昌、施永豐、林隆光、陳慕師、洪伯廷、侯平康 (1995) • 高度近視黃斑部萎縮之研究-與屈光度、眼軸長、年齡之關係• 慈濟醫學,7(1),29-37。
4. 林新智、謝瑞玟(2000) • 淡水馬偕護校學生眼屈光狀態─縱系列研究• 中華民國眼科醫學會雜誌,39(4),542-547。
5. 吳德敏、陳麗美(1989) • 台北市某兩所國中一年級學生視力狀況與視力保健知識態度行為相關性研究• 公共衛生,16(1),45-56。
6. 吳志翹(1998) • 台灣近視手術治療的現況• 臨床醫學,42(1),314-317。
7. 王藹侯、施永豐(1992) • 近視的原因--臨床觀察與動物實驗• 醫學繼續教育,2(6),901-904。
8. 王亦榮(1991) • 國民小學學生視力狀況與生活習慣之研究• 特殊教育與復健學報,1,133-180。
9. 施瑞華(1992) • 談父母管教態度和學生違規犯過行為之關係• 南投文教,74-75。
10. 施永豐(1993) • 脈絡叢血流循環與近視之關係• 慈濟醫學,5(4),259-265。
11. 施永豐(1995) • 如何來治療近視• 健康世界,109,105-109。
12. 施永豐、林隆光、王勢爵、柯良時(1993) • 實驗性近視之研究-Atropine 和Homatropine對雞近視的作用• 中華民國眼科醫學會雜誌,32(1),29-39。
13. 凌雲志、翁林仲、施永豐、林隆光、洪伯廷 (1997) • 高度近視眼視神經盤神經纖維層缺損之研究• 中華民國眼科醫學會雜誌,36(4),361-366。
14. 張永源、嚴雅音、王瑞霞(1984) • 高雄市學生近視有關因素之初步探討• 公共衛生,11(2),201-226。
15. 陳政友(1994) • 學生近視問題探討• 學校衛生,24,18-24。