跳到主要內容

臺灣博碩士論文加值系統

(35.153.100.128) 您好!臺灣時間:2022/01/22 07:28
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:廖于棻
研究生(外文):Yu-Fen Liao
論文名稱:通道偏移量分析以及不匹配環境下的電話語音辨認
論文名稱(外文):Channel Bias Analysis and Telephone-Speech Recognition with Mismatch Condition
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horing Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:47
中文關鍵詞:語音辨認通道偏移量
外文關鍵詞:Speech RecognitonChannel BiasMismatch
相關次數:
  • 被引用被引用:4
  • 點閱點閱:232
  • 評分評分:
  • 下載下載:26
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,首先由幾個不同的觀點來檢驗通道偏移量:在HMM訓練過程中,使用已知的HMM切割位置來估計通道偏移量,可以使得每個HMM狀態更為緊密。此外,也將SBR所估計的偏移量與上述HMM偏移量作一系列的比較。在此同時,觀察語料中語句的長短以及語音的穩定部分對於偏移量的影響,期望可以使用較少的語料來減少求取偏移量時間。之後,將研究重心移至不同語料庫之間的匹配問題:訓練語料採用MAT電話線語料庫,測試語料則是工研院所提供的ATC行動電話語料庫。首先發現CMN相較於SBR有較好的能力對抗語料庫間不匹配的問題,更深入的分析發現兩個語料庫之間的不同在於兩語料庫之間的距離。因此,我們根據HMM切割位置設計了一個遞迴的系統,來補償每一個ATC的輸入語料。使用ATC與MAT兩者中心點的距離來補償,所得到的辨認率為59.97%。而使用遞迴的系統,所得到的辨認率為58.42%。

In this thesis, we try to examine channel bias from several points of view. In HMM training procedure, bias estimated from HMM segment is addressed to compact each HMM model. Besides, a series of studies between SBR and HMM biases are perused. Meanwhile, to make bias evaluated more efficiently we also develop some ideas of involving syllable number and stable speech consideration. After that, the problem of mismatched condition in which HMM models (and SBR codebook) are trained in the MAT database and tested in a cellular-phone database provided by ATC, ITRI is discussed. We first find that CMN has a better ability than SBR to compensate the mismatch. A further study shows the mismatch is the mean vector of the HMM state between these two databases. Therefore, each ATC input feature can be compensated to match the MAT database by estimating mismatch recursively. The recognition rate of applying mismatch as database distance is 59.97%, which is a little higher than estimating mismatch recursively, 58.42%.

第一章 緒論…………………………………………………… 1
1.1 研究動機………………………………………………… 1
1.2 研究領域………………………………………………… 2
1.3 章節概要………………………………………………… 2
第二章 語音訊號前處理……………………………………… 3
2.1 去除直流偏移……………………………………………. 3
2.2 特徵參數抽取……………………………………………. 4
2.3 語者及通道補償…………………………………………. 6
2.4 隱藏式馬可夫模型………………………………………. 8
2.5 聲韻母之次音節模型……………………………………. 9
2.6 模型之訓練………………………………………………. 12
第三章 語者偏移量分析……………………………………… 13
3.1 語者HMM偏移量………………………………………… 13
3.2 語者SBR偏移量………………………………………… 18
3.3 語者偏移量與句子長短的關係………………………… 25
3.4 由部分語音求取偏移量………………………………… 26
3.4.1 藉助RNN預切割來求取偏移量…………………… 27
3.4.2 使用ΔMFCC估計語音穩定部分來求取偏移量… 29
第四章 誤差環境情況的電話語音辨認……………………… 33
4.1 誤差分析………………………………………………… 34
4.2 偏移量改進……………………………………………… 35
4.3 使用CMN偏移量………………………………………… 39
4.4 預測Mismatch…………………………………………… 40
4.5 Mismatch之改良………………………………………… 42
4.6 結論……………………………………………………… 43
第五章 結論與展望…………………………………………… 45

[1] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of speech recognition”, Prentice Hall, 1993.
[2] Mazin G. Rahim and Bing-Hwang Juang, “Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition,” IEEE Trans. on Speech and Audio Processing, vol.4, pp.19-30, January 1996.
[3] 蔣松茂,”以聲母為基礎之國語連續音辨認之改進”,國立交通大學碩士論文,民國八十四年六月。
[4] Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing”, John Wiley & Sons, INC. 2000.
[5] H. Hermansky, “Perceptual Linear Predictive (PLP) Analysis for Speech,” J. Acoust. Soc. Am., pp. 1738-1752, 1990.
[6] M. J. F. Gales and S. J. Young, “HMM Recognition in Noise Using Parallel Model Combination,” in Proc, Eurospeech, 1993, pp. 837-840.
[7] Yunxin Zhao, “An EM Algorithm for Linear Distortion Channel Estimation Based on Observations form a Mixture of Gaussian Sources,” IEEE Trans. on Speech and Audio Processing, vol.7, pp.400-413, July 1999.
[8] 廖元甫,”以模組化遞迴類神經網路為基礎之中文語音辨認”,國立交通大學博士論文,民國八十七年十二月。
[9] 呂儲仰,”國語連續音節辨認系統之改進與分析”,國立交通大學碩士論文,民國九十一年六月。
[10] 林威成,”使用遞迴式類神經網路之語音段切割”,國立交通大學碩士論文,民國九十一年六月。

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 朱樹勳,從臨床醫師角度看全民健保對醫療品質規範如何進行,全民健康保險雙月刊,第26期,民89年。
2. 王志堅,抗生素真 的萬能嗎?全民健康保險雙月刊,第32期,第12-14頁,民91年。
3. 周麗芳,預算、會計與統計三者分立─德國健康保險財務責任制度,全民健康保險雙月刊,第20期,民88年。
4. 張友珊,荷蘭總額預算醫療費用協定制度之探討,醫院,第32卷,第1期,第1-6頁,民88年。
5. 張彥輝、洪正芳、楊銘欽、翁瑞亨,以系統思考模式探討健保施行對醫療品質的影響,醫院,第32卷,第5期,第30-42頁,民88年。
6. 郭正全,台灣全民健康保險有實施總額預算的條件嗎?,醫院,第33卷,第4期,第2-5頁,民89年。
7. 陳振興,美國馬里蘭州醫療品質指標專案,研考報導,第43卷,第112-121頁,民87年。
8. 曾條昌,全民健康保險實施現況及未來展望,醫院,第33卷,第4期,第12-33頁,民89年。
9. 楊哲銘、王鳳君、洪啟宗、邱文達,區域醫院推動馬里蘭醫療品質指標計劃之實證經驗,醫療品質,第33卷,第6期,第17-25頁,民89年。
10. 楊銘欽、周雯雯,從民眾角度看全民健保,全民健康保險雙月刊,第18期,民88年。
11. 劉見祥,全民健保支付制度之趨勢,醫院,第32卷,第6期,第15-20頁,民88年。
12. 藍忠孚、洪錦墩,醫療費用總額支付制度之探討,全民健康保險雙月刊,第27期,民89年。