跳到主要內容

臺灣博碩士論文加值系統

(3.81.172.77) 您好!臺灣時間:2022/01/21 19:25
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:呂儲仰
研究生(外文):Chu-Yang Lu
論文名稱:國語連續音節辨認系統之改進與分析
論文名稱(外文):An Improvement on the HMM-based Continuous Mandarin Speech Recognition Method
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horng Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:60
中文關鍵詞:音節辨認右相關聲母模型環境不匹配遞迴式類神經網路語音切割連音聲學模型語者說話速度
外文關鍵詞:syllable recognitionright context dependent initial modelmismatchRNNspeech segmentcoarticulation modelspeaking rate
相關次數:
  • 被引用被引用:8
  • 點閱點閱:274
  • 評分評分:
  • 下載下載:51
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,我們針對右相關聲母模型進行系統的分析與改進,研究主題包含了對環境的不匹配,我們以三種不同的方法對之做初步的調適,均可得不錯的效果。另外,我們利用遞迴式類神經網路(RNN)的輸出參數來協助HMM訓練語音的切割,並用之標示出音節耦合的位置,藉以建立連音聲學模型來協助音節的辨認,由實驗結果可知,對於訓練語料的切割我們可對之做微幅的調整而獲得較正確的音節邊界,而對於連音聲學模型,其在長句的辨認也可得較佳的辨認結果。最後,我們利用最大似然機率法則找出特徵參數與語者說話速度間的關係,並用以調適語音模型,降低因語者說話速度不同所對辨認系統的影響,根據實驗結果顯示,其對於語者說話速度較大時可使辨認系統效能有所提升。
In this thesis, an improvement of the HMM-based continuous Mandarin speech recognition method, developed previously in NCTU, on the following aspects are discussed. Firstly, three schemes of compensating the environmental mismatch are discussed. One is to use the database mean difference directly. Another is the CMN method. The other is a mismatch prediction method. Secondly, the information of RNN speech segmentation is used to restrict the recognition search in both the training and testing phases. Experimental results showed that it is effective on refining the HMM models as well as on speeding up the recognition process. Thirdly, new recognition units to model serious inter-syllable coarticulation are constructed. Lastly, a new method of speaking rate normalization is discussed. The model tries to explore the relation of speaking rate and dynamic spectral features. The recognition performance was improved for high speaking rate utterances.
中文摘要 Ⅰ
英文摘要 Ⅱ
誌謝 Ⅲ
目錄 Ⅳ
表目錄 Ⅵ
誌謝 Ⅶ
第一章 緒論 1
1.1 研究動機 1
1.2 研究方向 1
1.3 章節概要 2
第二章 基本辨認系統 3
2.1 特徵參數抽取 3
2.2 語者及通道補償 5
2.3 聲韻母之次音節模型 7
2.4 隱藏式馬可夫模型 7
2.5 狀態長度模型 9
2.6 模型的訓練 10
2.7 音節的切割與辨認 10
第三章 基本系統之改進與分析 12
3.1 訓練語料 12
3.2 測試語料 13
3.3 辨認率的計算 14
3.4 基本實驗 14
3.5 狀態長度模型的修正 15
3.6 環境不匹配下的辨認系統分析 19
3.7 使用RNN輸出加權來協助 HMM訓練語音切割的方法 22
3.8 連音聲學模型之建立 26
3.8.1 初始模型的建立 27
3.8.2 模型的訓練 28
3.8.3 測試流程 30
3.8.4 結果分析 31
3.9 語者說話速度的調適 33
3.9.1 語者說話速度前處理 34
3.9.2 語者說話速度 36
3.9.3 模型的訓練 37
3.8.4 測試結果與分析 39
第四章 結論與未來展望 43
4.1 結論 43
4.2 未來展望 43
參考文獻 45
附錄一 47
附錄二 49
[1] Lawrence Rabiner and Bing-Hwang Juang, “Fundamentals of speech recognition”, Prentice Hall, 1993.
[2] 蔣昇倫,”經電話通道之國語連續411音節辨認”,國立交通大學碩士論文,民國八十六年六月。.
[3] Mazin G. Rahim and Bing-Hwang Juang, “Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition,” IEEE Trans. On Speech and Audio Processing, vol.4, pp.19-30, January 1996.
[4] 蔣松茂,“以聲韻母為基礎之國語連續音辨認之改進”, 國立交通大學碩士論文,民國八十四年六月。
[5] S. E. Levinson, L. R. Rabiner, and M. M. Sondhi, “An Introduction to the Application of the Theory of Probabilistic Function of a Markov Process to Automatic Speech Recognition,” The Bell System Technical Journal, Vol.62, No. 4, April 1983.
[6] 涂家章,“使用MAT2000語料庫之中文語音辨認”, 國立交通大學碩士論文,民國八十九年六月。
[7] 謝寶華,“使用前後文相關HMM模型之國語連續語音辨認”, 國立交通大學碩士論文,民國九十年六月。
[8] Dempster, A., Laird, N., Rubin, D., “Maximum likelihood from incomplete data via the EM algorithm,” Journal of Royal Statistical Society 39, 1-38, 1977.
[9] H. Ney, “The Use of a One-Stage Dynamic Programming Algorithm for Connected Word Recognition,” IEEE Trans. Acoustics, Speech, Signal Processing, vol.32, no.2, pp.263-271, April 1984.
[10] 林威成,“使用遞迴式類神經網路之音段切割”, 國立交通大學碩士論文,民國九十一年六月。
[11] 廖于棻,“通道偏移量分析以及不匹配環境下的電話語音辨認”, 國立交通大學碩士論文,民國九十一年六月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 21. 邱華君,「人力資源發展」,人力發展月刊,第75期,民89。
2. 19. 官政哲,「廿一世紀警察人力資源管理與教育發展之理念與策略」,警專學報,第8期,民84。
3. 16. 林玉鬃,「海關現職關務人員改任換敘問題探討」,人事月刊,第14卷第6期,民81。
4. 14. 李聲吼,「人力資源發展的能力內涵」,就業與訓練,第15卷第2期,民86。
5. 13. 李震洲,「甲等特考法源刪除始末」,人事月刊,第20卷第1期,民84。
6. 12. 李興唐,「從警察歷史談政教配合」,警光雜誌,第216期,民63。
7. 11. 李嵩茂,「海岸巡防機關人員擔任司法警察執行犯罪調查職務相關問題之研究(上)」,法務通訊,第2017期,民90。
8. 9. 李漢雄、郭書齊等著,「提昇競爭優勢的人力資源策略:談創造力發展與創新活動」,勞資關係論叢,第7期,民87。
9. 6. 江慶興,「英國警察教育訓練特點研析」,警光雜誌,第495期,民86。
10. 5. 羊憶蓉,「一九九O年代的澳洲教育改革:核心能力取向的教育計劃」,教改通訊,第20期,民85。
11. 3. 朱金池,「影響組織承諾因素之研究」,警政學報,第19期,民80。
12. 19. 林芸芸、江東亮,醫師對全民健康保險的預期影響調查,中華醫學雜誌,第9卷,民81年。
13. 18. 林芸芸、江東亮,醫師對全民健康保險的意見調查,中華民國公共衛生學會雜誌,第9卷,民81年。
14. 17. 施存豐、楊志良,勞保甲乙丙表的實施對其門診用藥費用之影響,醫院雜誌,第二卷,民83年。
15. 16. 郭信智、楊志良,勞保門診醫療費用支付制度對醫療供給者診療行為之影響,中華公共衛生雜誌,第3卷,民83年。