(3.238.173.209) 您好!臺灣時間:2021/05/12 13:42
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:黃詩涵
研究生(外文):Shih-Han Huang
論文名稱:基於隱藏式條件隨機域聲學模型之強健式華英混雜語音辨認演算法
論文名稱(外文):Mixed-Lingual Acoustic Modeling of Hidden Conditional Random Field for Robust Speech Recognition
指導教授:洪維廷洪維廷引用關係
學位類別:碩士
校院名稱:元智大學
系所名稱:通訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2011
畢業學年度:99
語文別:中文
論文頁數:77
中文關鍵詞:隱藏式條件隨機域聲學模型、語音辨識、強健式訓練
外文關鍵詞:HMM、HCRF、Robust Training Algorithm
相關次數:
  • 被引用被引用:0
  • 點閱點閱:105
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文提出以強健式演算法(論文中簡稱REST)訓練隱藏式條件隨機域(Hidden Conditional Random Fields,簡稱HCRF)華語/英語聲學模型,嘗試解決(1)混
雜語音語音辨認之抗雜訊問題和(2)混雜語音語音辨認之跨語系辨認錯誤問題。REST演算法可以提高HCRF模型對雜訊環境的辨識效能,接著透過鑑別式法則訓練HCRF模型,提升HCRF模型對語音模型的鑑別能力,並且大幅降低跨語言語音辨認之錯誤。根據一連串之實驗證明,基於HCRF語音模型之錯誤率平均值比傳統HMM降低約16.41%(Rover_2雜訊),並且跨語言語音辨認之錯誤大幅降低。

This thesis presents the robust training techniques for hidden conditional random fiels (HCRF)-based acoustic modeling of Mandarin/English mixed-lingual speech recognition. Two issues were dealt with: (1) mixed-lingual speech recognition against with noise effects and (2) cross-lingual errors in mixed-lingual speech recognition. We solved first issue with the REST algorithm and reduce the errors in second issue with a discriminative training algorithm combined by the REST algorithm(D-REST). The experimental results indicate that 16.4% averaged error rate reduction by the HCRF-based framework is achieved under ROVER_2 noise environment compared with the result by the traditional HMM approach. In additional, the cross-lingual error is improved significantly with the HCRF-framework in mixed-lingual speech recognition.

書名頁i
論文口試委員審定書ii
授權書iii
中文摘要iv
英文摘要v
誌謝vi
目錄vii
表目錄ix
圖目錄xiii
一、序論1
1.1 研究動機1
1.2 文獻回顧1
1.3 研究概述2
1.4 論文大綱2
二、演算法介紹3
2.1 隱藏式條件隨機域3
2.2 最小分類錯誤演算法5
2.3 鑑別式強健演算法7
三、隱藏式條件隨機域之強健式華英混雜語音辨識系統10
3.1 HCRF模型補償演算法11
3.2 最小分類錯誤演算法之訓練語料模型實作13
3.3 詞典庫15
四、實驗分析18
4.1 實驗設定18
4.1.1 華語與英語模型18
4.1.2 訓練語料19
4.1.3 測試語料21
4.1.4 雜訊介紹21
4.2 訓練流程22
4.3 測試流程23
4.4 效能分析24
4.4.1 訓練語料的影響25
4.4.2 雜訊的影響26
4.4.3 高斯混合數的影響28
4.4.4 整體辨識分析29
4.4.5 測試方法的影響31
4.4.6 跨語言錯誤之分析34
五、結論36
參考文獻38
附錄甲:訓練模型Multi-SNR在32Mixture之下,各組雜訊辨認平均錯誤率40
附錄乙:訓練模型Multi-Noise在32Mixture之下,各組雜訊辨認平均錯率.58
附錄丙75
附錄丁:英語語音音素76

[1] L. Rabiner, “A tutorial on hidden markov models and selected applications in speech recognition,” Proceedings of the IEEE, vol. 77, pp. 257–286, 1989.
[2] A. Varga and R. Moore, “Hidden markov model decomposition of speech and noise,” in Proceedings International Conference on Acoustics, Speech, and Signal
Processing, pp. 845–848, 1990.
[3] S. B. Wang, A. Quattoni, L.-P. Morency, D. Demirdjian, and T. Darrell, “Hidden conditional random fields for gesture recognition,” in Proceedings IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol. 2, pp. 1521–1527, 2006.
[4] M. Mahajan, A. Gunawardana, and A. Acero, “Training algorithms for hidden conditional random fields,” in Proceedings International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 273–276, 2006.
[5] Y.-H. Sung, C. Boulis, C. Manning, and D. Jurafsky, “Regularization, adaptation, and non-independent features improve hidden conditional random fields for phone classification,” in Proceedings IEEE Workshop on Automatic Speech Recognition & Understanding, pp. 347–352, 2007.
[6] B. H. Juang and S. Katagirl, “Discriminative learning for minimum error classification,” Signal Processing, IEEE Transactions on, vol. 40, pp. 3043–3054,1992.
[7] W. Chou, B. Juang, and C. Lee, “Segmental gpd training of hmm-based speech recognizer,” in Proceedings IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 473–476, 1992.
[8] W.-T. Hong and S.-H. Chen, “A robust training algorithm for adverse speech recognition,” Speech Communication., vol. 30, pp. 273–293, 2000.
[9] W.-T. Hong, “A discriminative and robust training algorithm for noisy speech recognition,” in Proceedings IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 8–11, 2003.
[10] B. G. Leroux, “Maximum-likelihood estimation for hidden markov models,” Stochastic Processes and their Application, vol. 40, pp. 127–143, 1992.
[11] 李秋芬, “基於隱藏式條件隨機域聲學模型之強健式訓練演算法,” Master’s thesis, 元智大學通訊工程學系, 民國97年.
[12] H. Ney, “The use of a one stage dynamic programming algorithm for connected word recognition,” IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 32, pp. 263–271, 1984.
[13] 王小川, 語音訊號處理. 全華圖書股份有限公司, 2009.
[14] H. C.Wang, F. Seide, C. Y. Tseng, and L. S. Lee, “Mat2000 – design, collection, and validation on a mandarin 2000-speaker telephone speech database,” in 6th International Conference on Spoken Language Processing, pp. 460–463, 2000.
[15] The Association for Computational Linguistics and Chinese Language Processing, http://www.aclclp.org.tw/doc/eat_brief.pdf, 台灣口音英語語料.
[16] Signal Processing Information Base, http://spib.rice.edu/.
[17] NTT Advanced Technology Corporation, http://www.ntt-at.com/products_e/noise-DB/index.html, Ambient Noise Database for Telephonometry.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關論文
 
1. 黃文榮:〈三國版本知多少〉,台北:《國文天地》第20卷5期,2004年10月。
2. 徐朔方:〈論《三國演義》的成書〉,台北:《中國書目季刊》第28卷第1期,1994年6月。
3. 陳美玲:〈從性格刻畫的角度比較《三國演義》中的兩大奸雄曹操和司馬懿〉,台中:《中國文化月刊》第284期,2004年8月。
4. 胡志佳:〈三國外交使節之研究〉,台中:《逢甲人文社會學報》第2期,2001年5月。
5. 黃文榮:〈曹操的軍事幕僚研究-以軍師、參軍與軍掾為例〉,台北:《輔仁歷史學報》第16期,2005年7月。
6. 張錯:〈缺憾的完成-《三國演義》的悲劇架構〉,台北:《當代》第169期,2001年9月。
7. 張錯:〈缺憾的完成-《三國演義》的悲劇架構〉,台北:《當代》第169期,2001年9月。
8. 張火慶:〈兩朝開濟老臣心-《三國演義》中的諸葛亮〉,台北:《鵝湖月刊》第3卷第4期,1977年10月。
9. 陳美玲:〈從性格刻畫的角度比較《三國演義》中的兩大奸雄曹操和司馬懿〉,台中:《中國文化月刊》第284期,2004年8月。
10. 張火慶:〈兩朝開濟老臣心-《三國演義》中的諸葛亮〉,台北:《鵝湖月刊》第3卷第4期,1977年10月。
11. 黃文榮:〈曹操的軍事幕僚研究-以軍師、參軍與軍掾為例〉,台北:《輔仁歷史學報》第16期,2005年7月。
12. 馬顯慈:〈從修辭格的運用看《三國》《水滸》之文藝特色〉,香港:《新亞學報》第25期,2007年1月。
13. 黃文榮:〈三國版本知多少〉,台北:《國文天地》第20卷5期,2004年10月。
14. 胡志佳:〈三國外交使節之研究〉,台中:《逢甲人文社會學報》第2期,2001年5月。
15. 洪武雄:〈蜀漢的都督〉,台中:《中國醫藥大學通識教育學報》第8期,2005年12月。
 
系統版面圖檔 系統版面圖檔