(3.227.235.183) 您好!臺灣時間:2021/04/13 21:36
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:翁健峰
論文名稱:用隱藏式馬可夫方法於時域特徵之國語數字辨認
指導教授:黎自奮李宗寶
學位類別:碩士
校院名稱:國立中興大學
系所名稱:應用數學系
學門:數學及統計學門
學類:數學學類
論文種類:學術論文
論文出版年:2003
畢業學年度:91
語文別:中文
中文關鍵詞:語音辨識隱藏式馬可夫
相關次數:
  • 被引用被引用:2
  • 點閱點閱:103
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
由於電腦的蓬勃發展,人們使用電腦的頻率急速上升,而我們在憑藉著滑鼠、鍵盤等工具輸入命令來控制電腦的同時,以語音來作為輸入是另一種很好的選擇。尤其語音辨認的應用在生活中能帶給我們多方便,在身分識別,聲控器具方便都有很大的研究空間。因此利用語音辨識可以使我們輕鬆擁有一個簡單的高品質生活空間,讓人們的生活方式更簡單、更人性化。
本論文研究的方向是國語數字的0~9。在語音的辨識比對方面,我們採用了兩種不同的比對方法來辨識語音,分別是狀態法與平均分配法。因為比對方法的不同,所以訓練模型也會有所不同,而所得到的辨識率也有所不同。其中狀態法需要訓練模型,經由訓練模型可以得到三組平均值與變異數來作為資料庫;而平均分配法不需要訓練模型,直接拿所有的特徵參數來作為資料庫。因此在資料庫方面,平均分配法的資料庫比狀態法的資料庫明顯的大了很多;因此就辨識率方面而言,狀態法的平均辨識率為89.1%,而平均分配法的平均辨識率為91.8%,因為狀態法只用了三組資料作為資料庫,平均分配法則是用了所有的資料作為資料庫,因此平均分配法的辨識率比狀態法的辨識率高了一點。
一、序論……………………………………………………1
1.1 研究動機與目的………………………………………1
1.2 國內外研究概況………………………………………2
1.3 應用領域與研究範圍…………………………………3
1.4 語音辨認的種類………………………………………5
1.5 語音辨識方法概述……………………………………5
1.6 本論文架構……………………………………………12
二、語音訊號的前處理與特徵參數………………………14
2.1 數位取樣………………………………………………16
2.2 常態化…………………………………………………17
2.3 去除靜音………………………………………………20
2.4 切割音框………………………………………………22
2.5 預強調的處理…………………………………………24
2.6 視窗化的處理…………………………………………25
2.7 特徵參數的求取………………………………………26
2.8 線性預估編碼…………………………………………27
2.9 自相關函數……………………………………………29
2.10 倒頻譜參數…………………………………………31
2.11 代通提昇視窗處理…………………………………32
2.12 差倒頻譜……………………………………………32
三、語音訓練模型…………………………………………35
3.1 狀態法…………………………………………………37
3.2 均切成三個狀態………………………………………40
3.3 狀態的平均值與變異數………………………………40
3.4 音框與狀態的相似程度………………………………43
3.5 維特比演算法…………………………………………43
3.6 更新狀態內的音框……………………………………47
3.7 新狀態的平均值與變異數……………………………47
3.8 新的音框與狀態的相似程度…………………………48
3.9 判斷結束或繼續遞迴…………………………………48
四、語音辨識的方法………………………………………50
4.1 狀態法…………………………………………………50
4.1.1 預辨識語音前處理與求取特徵參數………………52
4.1.2 計算音框與狀態的機率……………………………53
4.1.3 維特比演算法………………………………………54
4.2 平均分配法……………………………………………55
4.2.1 多對少………………………………………………56
4.2.2 相同組數……………………………………………57
4.2.3 少對多………………………………………………57
五、實驗操作流程與實驗結果……………………………60
5.1 系統程式語言…………………………………………60
5.2 實驗操作流程…………………………………………61
5.3 實驗結果………………………………………………64
六、結論及未來研究方向…………………………………65
6.1 結論……………………………………………………65
6.2 未來研究方向…………………………………………65
參考文獻……………………………………………………67
Harb, H.; Husseiny, A.H.; ” Isolated words recognition using neural networks ” Electronics, Circuits and Systems, 2000. ICECS 2000. The 7th IEEE International Conference on , Volume: 1 , 2000 Page(s): 349 -351 vol.1
Butzberger, J.W., Jr.; Ostendorf, M.; Price, P.J.; Shattuck-Hufnagel, S.; ” Isolated word intonation recognition using hidden Markov models ” Acoustics, Speech, and Signal Processing, 1990. ICASSP-90., 1990 International Conference on , 3-6 Apr 1990 Page(s): 773 -776 vol.2
Lim, C.P.; Woo, S.C.; Loh, A.S.; Osman, R.; ” Speech recognition using artificial neural networks ” Web Information Systems Engineering, 2000. Proceedings of the First International Conference on , Volume: 1 , 2000 Page(s): 419 -423 vol.1
Li Sheng-Li; Hou Chao-Huan; ” A study of speech recognition based on fuzzy statistics ” Signal Processing, 1996., 3rd International Conference on , Volume: 1 , 14-18 Oct 1996 Page(s): 757 -760 vol.1
Hsien-Leing Tsai; Shie-Jue Lee; ” A neural network model for spoken word recognition ” Systems, Man, and Cybernetics, 1997. 'Computational Cybernetics and Simulation'., 1997 IEEE International Conference on , Volume: 5 , 12-15 Oct 1997
Page(s): 4029 -4034 vol.5
Bilginer Gulmezoglu, M.; Dzhafarov, V.; Keskin, M.; Barkana, A.; ” A novel approach to isolated word recognition ” Speech and Audio Processing, IEEE Transactions on , Volume: 7 Issue: 6 , Nov 1999 Page(s): 620 —628
Masuko, T.; Tokuda, K.; Kobayashi, T.; Imai, S.; ” Speech synthesis using HMMs with dynamic features ” Acoustics, Speech, and Signal Processing, 1996.ICASSP-96. Conference Proceedings., 1996 IEEE International Conference on , Volume: 1 , 7-10 May 1996 Page(s): 389 -392 vol. 1
Lawrence Rabiner ; Biing-Hwang Juang , ” Fundamentals of Speech Recognition ” , Prentice Hall PTR , 1993
Harte, N.; Vaseghi, S.; Milner, B.; ” Dynamic features for segmental speech recognition ” Spoken Language, 1996. ICSLP 96. Proceedings., Fourth International Conference on , Volume: 2 , 3-6 Oct 1996 Page(s): 933 -936 vol.2
Tze Fen Li , ” Speech Recognition of Mandarin Monosyllables” ,Pattern Recognition,2003.Will appear.
黎自奮,蕭玉章(1994)。”多種單音數字語音辨認方法”。碩士論文,私立逢甲應用數學研究所,台中。
曾怜玉,楊榮偉(1993)。“ The Recognition of the Isolated Mandarin Digits in a Noisy Environment ”。碩士論文,國立中興應用數學研究所,台中。
楊鎮光(2002)。” Visual Basic與語音辨識-讓電腦聽話 ”, 松崗出版社。
謝雲飛(1986)。 ” 語音學大綱 ” , 台灣學生書局。
陳明熒(1994)。 ” PC電腦語音辨認實作 ” , 旗標出版社。
謝秀琴(1996)。 ” 數位語音訊號基本原理 ” , 全華出版社。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔