研究生(外文):Shin-Fan Yang
論文名稱(外文):A Preliminary Study on Elder Mandarin Speech Recognition
指導教授(外文):Ying-Ru Wang
外文關鍵詞:elder speech
In this thesis, to build up an elder Mandarin speech recognizer used the collected elder speech corpus, then that syllable recognition to reach 44.72%; moreover, using Maximal Likelihood Linear Regression to adapt the elder corpus by TCC-300 acoustic model. When extracting speech feature, utilizing Vocal Tract Length Normalization to modify the property of the elder voice is to low. When the speech frequency of the elder corpus is warping to be close to the youth speech frequency, we implement the MLLR adaptation; moreover, to use iteration VTLN+MLLR to improve the recognition. Final, to analyze different elder accent to cause distinct result on adaptation and recognition, then we find the MLLR adaptation can decrease the effect by different accent. The VTLN+MLLR adaptation can improve the syllable recognition to reach 51.47%
中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
表目錄 VII
圖目錄 VIII
第一章 緒論 1
1.1 研究動機 1
1.2 研究方向 1
1.3 章節概要 2
第二章 老人語音的特性 4
2.1 語者發音的原理 4
2.1.1 發音器官簡介 5
2.1.2 發音過程簡介 5
2.2 老人聲道變化對共振峰的影響 6
2.3 老人語音特性的歸納 7
第三章 老人語音資料庫 9
3.1 老人語料庫之簡介 9
3.1.1 音檔格式說明 9
3.1.2 錄音者的年紀分布 10
3.1.3 音檔內容的統計 10
3.2 訓練語料與測試語料 11
3.3 調適語料與被調適的HMM模型 12
3.4 老人語料的特性與問題歸納 13
第四章 基本老人語音辨識系統 14
4.1 老人語音的基本辨識系統 14
4.1.1 系統環境參數設定 15
4.1.2 聲學模型及其訓練與測試 17
4.2 建立多語者(multi-speaker)聲學模型與實驗 17
4.3 說話速度(speaking rate)對老人語音辨識系統之影響 22
第五章 調適系統與聲道長度正規化 25
5.1 最大可能性線性回歸(MLLR)簡介 25
5.2 老人語料進行MLLR調適之實驗 27
5.3 老人語音腔調的差異 29
5.4 聲道長度正規化 31
第六章 結論與未來展望 40
6.1 結論 40
6.2 未來展望 40
參考文獻 42
附錄一 44
附錄二 46
附錄三 47
附錄四 48

