跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.87) 您好!臺灣時間:2024/12/04 02:19
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:楊世帆
研究生(外文):Shin-Fan Yang
論文名稱:老人中文語音辨識之初步研究
論文名稱(外文):A Preliminary Study on Elder Mandarin Speech Recognition
指導教授:王逸如王逸如引用關係
指導教授(外文):Ying-Ru Wang
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
畢業學年度:96
語文別:中文
論文頁數:49
中文關鍵詞:老人語音
外文關鍵詞:elder speech
相關次數:
  • 被引用被引用:3
  • 點閱點閱:476
  • 評分評分:
  • 下載下載:85
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,從收集的老人語料建立起一個老人中文語音辨識系統,而這個老人中文語音辨識系統的syllable辨識率達44.72%。然後使用TCC-300聲學模型來進行老人語料的調適,選用的調適方法為最大可能性線性迴歸;並且在特徵參數抽取時,使用聲道長度正規化來改善老人聲音低沉的特性,當老人語料的聲音頻率被彎曲至較相似年輕人時,再作最大可能性線性迴歸的調適。而且重複VTLN加上MLLR的調適方法來改善辨識率。最後也分析老人語音腔調差異對辨識與調適的影響,並發現腔調差異的影響可由調適過程來改善;而經由VTLN加上MLLR的調適過程,可以得到最終的音節辨識率達51.47%。
In this thesis, to build up an elder Mandarin speech recognizer used the collected elder speech corpus, then that syllable recognition to reach 44.72%; moreover, using Maximal Likelihood Linear Regression to adapt the elder corpus by TCC-300 acoustic model. When extracting speech feature, utilizing Vocal Tract Length Normalization to modify the property of the elder voice is to low. When the speech frequency of the elder corpus is warping to be close to the youth speech frequency, we implement the MLLR adaptation; moreover, to use iteration VTLN+MLLR to improve the recognition. Final, to analyze different elder accent to cause distinct result on adaptation and recognition, then we find the MLLR adaptation can decrease the effect by different accent. The VTLN+MLLR adaptation can improve the syllable recognition to reach 51.47%
中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
表目錄 VII
圖目錄 VIII
第一章 緒論 1
1.1 研究動機 1
1.2 研究方向 1
1.3 章節概要 2
第二章 老人語音的特性 4
2.1 語者發音的原理 4
2.1.1 發音器官簡介 5
2.1.2 發音過程簡介 5
2.2 老人聲道變化對共振峰的影響 6
2.3 老人語音特性的歸納 7
第三章 老人語音資料庫 9
3.1 老人語料庫之簡介 9
3.1.1 音檔格式說明 9
3.1.2 錄音者的年紀分布 10
3.1.3 音檔內容的統計 10
3.2 訓練語料與測試語料 11
3.3 調適語料與被調適的HMM模型 12
3.4 老人語料的特性與問題歸納 13
第四章 基本老人語音辨識系統 14
4.1 老人語音的基本辨識系統 14
4.1.1 系統環境參數設定 15
4.1.2 聲學模型及其訓練與測試 17
4.2 建立多語者(multi-speaker)聲學模型與實驗 17
4.3 說話速度(speaking rate)對老人語音辨識系統之影響 22
第五章 調適系統與聲道長度正規化 25
5.1 最大可能性線性回歸(MLLR)簡介 25
5.2 老人語料進行MLLR調適之實驗 27
5.3 老人語音腔調的差異 29
5.4 聲道長度正規化 31
第六章 結論與未來展望 40
6.1 結論 40
6.2 未來展望 40
參考文獻 42
附錄一 44
附錄二 46
附錄三 47
附錄四 48
【1】吳光明,”呼吸氣流對發音特徵與模型影響之研究”,台灣科技大學,中華民國九十四年七月

【2】P.B. Denes and E.N. Pinson,"The Speech Chain", 1993, W.H. Freeman New York, p.5

【3】http--www.telecom.tuc.gr-~ntsourak-tutorial_acoustic.htm

【4】An Xue, Jack Jiang, Emily Lin and Peter B. Mueller,"Age-related changes in human vocal tract configurations and the effects on speakers' vowel formant frequencies: a pilot study",Ohio University, Athens, OH, Northwestern University Medical School, Chicago, IL, Kent State University, Kent OH, USA,Log Phon Vocol 1998; 24: 132–137

【5】Linville SE, Fisher HB. "Acoustic characteristics of women’s voices with advancing age." J Gerontol 1985; 40:324–30.

【6】Rastatter MP, Jacques RD. "Formant frequency structure of the aging male and female vocal tract." Folia Phoniatr 1990; 42: 312–9.

【7】Association for Computational Linguistics and Chinese Language Processing Institute of Information Science, Academia Sinica,"MAT-2000" and "MAT-2500"

【8】Heidi Christensen, Ove Andersen, Borge Lindberg, "Speaker Adaptation of Hidden Markov Models using Maximum Likelihood Linear Regression" Aalborg University, 1996

【9】Steve Young, Gunnar Evermann, Mark Gales, etc. "The HTK Book (for HTK Version 3.4)", Cambridge University Engineering Department, 2001-2006

【10】梁振豊,"台語語音辨識及智慧型口語對話汽車導航系統",國立交通大學,中華民國九十五年八月

【11】張隆勳,"國語廣播新聞語音基本系統之建立",國立交通大學,中華民國九十四年六月

【12】Xuedong Huang, Alex Acero, Hsiao-Wuen Hon, "Spoken Language Processing, A guide to Theory,Algorithm, and System Development," Prentice-Hall, Inc.

【13】王小川,"語音訊號處理",全華科技圖書,中華民國九十三年

【14】陳克巽,"非監督式快速語者調適演算法研究",國立中央大學,中華民國八十九年六月

【15】X. Huang and K.F. Lee, "On Speaker-Independent, Speaker-Dependent, and Speaker-Adaptive Speech Recognition." IEEE Trans. on Speech and Audio Proc., Vol. 12, pp. 150–157, April 1993

【16】Puming Zhan and Alex Waibel, "Vocal Tract Length Normalization for Large Vocabulary Continuous Speech Recognition", CMU-CS-97-148, May 1997
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top