跳到主要內容

臺灣博碩士論文加值系統

(54.224.117.125) 您好!臺灣時間:2022/01/23 20:45
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:黃朝元 
研究生(外文):Huang Chao Yuan
論文名稱:隱藏式馬可夫模型於聲控選單環境控制系統之應用
論文名稱(外文):The Application of Hidden Markov Model to a Menu-Driven Environmental Control System.
指導教授:陶金旭
指導教授(外文):Jinshuih Taur
學位類別:碩士
校院名稱:國立中興大學
系所名稱:電機工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:81
中文關鍵詞:前後型
外文關鍵詞:left-to-right
相關次數:
  • 被引用被引用:0
  • 點閱點閱:620
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:2
針對行動不便的病患,設計一套語音控制環境系統選單,使用者發出不同數字(0-9)聲音容易地選擇想要的功能來控制環境,以達到病人在家、工作、休閒等環境下的功能與獨立性。
本論文研究利用以MFCC(Mel Frequency Cepstrum Computation)汲取出語音的特徵參數,以連續型隱藏式馬可夫模型(Continuous Observation Hidden Markov Model )為主的語音辨識演算法,應用連續型隱藏式馬可夫模型,分別建立各個語音的模型。在隱性馬可夫模型上,使用"前後型"的模型,並且在計算機率時引用連續性機率的函數,訓練時,k-means分割疊代程序提供良好的初始估測,使用疊代的方法估測每個數字模型,因為疊代會使新的模型更接近這個數字的最佳模型,辨識時計算所有模型機率找出最大結果即是。研究以單一發語者為實驗,實驗不同樣本數,不同混合數和不同狀態數對系統辯識影響。實驗結果顯示在使用狀態數5、混合數3和樣本數70下,可達99.3%的辨識率。
Abstract
In this thesis, a menu-driven environmental control system is designed for the individuals with disabilities. According to the number of different sounds (0-9) that the user can utter, the menu-driven system is designed to facilitate the selection of the desired function provided in the environmental control system to improve the recreation ability, the functionality, and the independence of the individual with disability.
Speech feature parameter extraction by using mel frequency cepstrum computation (MFCC) technology is studied. The continuous observation hidden markov model (HMM) is used as the basis of speech recognition system. In the model topology, the left-to-right speech model and the continuous probability density function are adapted. In the training, segmental k-means segmentation with clustering provided good initial estimates, each number’s mode parameter was reestimated by iteration procedure, new mode parameter must be close to optimal mode parameter. In the recognition procedure, computing all mode was to find the best result of probability in HMM. The study is based on the single speaker with different samples, states and mixtures to test the effectiveness of the recognition system. Experimental results show that the system can achieve recognition rate 99.3% using five states, three mixtures and seventy samples for each class.
第一章 緒論..
1.1研究動機與目的
1.2文獻回顧
1.3論文大綱
第二章 特徵汲取理論
2.1介紹
2.2類比轉為數位
2.2.1語音訊號的結構特徵
2.3特徵汲取
2.3.1訊號的前置處理
2.3.2上窗
2.3.3音譜分析
2.3.4濾波器組處理
2.3.5對數能量計算
2.3.6 MFCC
2.3.7 係數和能量
第三章 隱藏式馬可夫模型理論
3.1 前言
3.2 機率計算
3.2.1 前算程序
3.2.2 後算程序
3.3 最佳化的狀態序列
3.3.1 Viterbi演算法
3.4 連續性觀察密度
3.5 模型參數重估測
3.6 對於HMMs的實現問題
3.6.1定標
3.6.2複合觀測序列
3.6.3 HMM參數的初始值估測
3.6.4不適合訓練資料的影響
3.6.5 模型選擇
第四章 實驗結果與比較
4.1 系統介紹
4.1.1語音特徵汲取
4.1.2訓練隱藏式馬可夫模型參數
4.1.3 語音辨識程序
4.2 語音樣本數對辨識系統的影響
4.3 隱藏式馬可夫模型的狀態數對辨識系統的影響
4.4隱藏式馬可夫模型的混合數對辨識系統的影響
第五章 結論與未來展望
5.1 結論
5.2 未來展望
參考文獻
[1] Juang B. H.,“On the Hidden Markov Model and Dynamic Time Warping for Speech Recognition-A Unified View, ”AT&T B.S.T. Jvol. 63 , no.7 Sep. 1984
[2] Gold B., Lippmann R., “A Neural Network for Isolated-word Recognition, ”ICASSP-88, pp. 44-47,1988
[3] Rabiner L. R., Shafer R. W., Digital Processing Of Speech Signal, Prentice Hall, 1978
[4] Davis S. B., Mermelstein P.,“Comparison of parametric representations of monosyllabic word recognition in continuously spoken sentences”, IEEE Trans. Acoustics, Speech and Signal Processing, 28, pp.357-366, 1980
[5] Oppenheim A. V. and Shafer R. W., Digital Signal Processing, Prentice Hall, 1989
[6] 宗孔德,胡廣書, 數位訊號處理, 儒林出版社, p307-334, 1996
[7] Flannery B. P., Teukolsky S.A., Vetterling W.T., Numerical Recipes in C, Cambridge University Press, 1990
[8] Jayant N. O. S., Noll P., Digital Coding of Waveforms, Prentice Hall, 1984
[9]Furui S.,“Cepstral analysis techniques for automatic speaker verification, ”IEEE Tran. On ASSP, 29, No. 2. pp. 254-272
[10]Bocchieri E., Wilpon J.G.,“Discriminative feature selection for speech recognition,”Computer Speech and Language, 7, pp. 229-246, 1993
[11] Claudio Becchetti, Lucio Prina Ricotti,“Speech Recognition Theory and C++ Implementation”,Speech signal analysis, 3,pp. 122-134,1999
[12] Rabiner L. R., Juang B. H., Fundamentals of Speech Recognition, Prentice Hall, 1993
[13] Xuang X. D., Ariki Y., Jack M.A.,“Hidden Markov Models for Speech Recognition”, Edinburgh University Press, chap 7, pp. 187-205, 1990
[14] Yummin Lee, Lin-Shan Lee,“Continuous Hidden Markov Models integrating transitional and instantaneous features for Mandarin syllable recognition”,Computer Speech and Language, vol 7l, pp. 247-263, 1993
[15] Viterbi A. J.,“Error bounds for convolution codes and an asymptotically optimal decoding algorithm”, IEEE Trans. Information Theory, IT-13:260-269, April 1967
[16] Forney G. D., “The Viterbi algorithm”, Proc. IEEE, 61:268-278, March 1973
[17] Liporace L.A., “Maximum likelihood estimation for multivariate observations of Markov sources”, IEEE Trans. Information Theory, IT-28 (5): 729-734, 1982
[18] Juang B. H.,“Maximum likelihood estimation for mixture multivariate stochastic observations of Markov chains”, AT&T Tech. J. 64(6): 1235-1249,July-Aug, 1985
[19] Juang B. H., Levinson S. E., Sondhi M. M., “Maximum likelihood estimation for multivariate mixture stochastic observations of Markov chains”, IEEE Trans. Information Theory, IT-32(2):307-309, March, 1986
[20] Juang B. H., Rabiner L. R.,“Mixture autoregressive hidden Markove models for speech signals”, IEEE Trans. Acoustics, Speech, Signal Proc., ASSP-33(6): 1404-1413, December 1985
[21] Jelinek F., Mercer R. L.,“Interpolated estimation of Markove source parameters from sparse data”, in pattern Recognition in Practice, Gelesma E. S., Kanal L. N., Eds. Amsterdam, The Netherlands: North-Holland, 381-397, 1980
[22] Rabiner L. R., Wilpon J. G., Juang B. H., “A Segmental K-means training procedure for connected word recognition based on whole word reference patterns”, AT&T Tech. j. vol.65, no.3, pp. 21-31, May/June, 1986
[23] Lee C. H., Lin C. H., Juang B. H.,“A study on speaker adaptation of the parameters of continuous density hidden Markov models”, IEEE Trans. Signal Processing,39(4): 806-841,April 1991
[24] Rabiner L. R., Juang B. H., Levinson S. E., Sondhi M. M.,“Recognition of Isolated Digits Using Hidden Markove Models With Continuous Mixture Densities”, AT&T Tech. J., 64(6): 1211-1234, July-Aug. 1985
[25] 楊永泰, 隱藏式馬可夫模型應用於中文語音辨識之研究,中原大
學資訊工程學碩士論文,2000
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關論文
 
1. 陳正昌(民86):從態度層面談教師批判思考的內涵與精神。教育研究,第57期,頁48-54。
2. 郭重吉(民76b):評介學習風格之有關研究。資優教育季刊,第23期,頁7-16。
3. 郭重吉(民76a):英美等國晚近對學生學習風格之研究。資優教育季刊,第22期,頁2-8。
4. 張玉成(民81):國小語文科實施批判思考教學之實驗研究。臺北師院學報,第5期,頁1-66。
5. 胡夢鯨(民77):從思想研究的本質與步驟談「回歸原典」的必要性。現代教育,3卷2期,頁150-161。
6. 林邦傑(民71):國中學生場地獨立性與具體運思、形式運思之關係。中華心理學刊,24卷,第2期, 頁101-110。
7. 吳裕益(民76)認知能力與認知型態個別差異現象之探討。國立高雄師範學院教育學刊7期,頁51-98。
8. 吳靜吉、丁興祥、王敬仁、蘇宏林、戴禮明(民68):場地獨立性的發展及其相關因素之研究,教育與心理研究,第3期,頁118-140。
9. 吳靜吉、 葉玉珠(民81):康乃爾批判思考測驗甲式之修訂。測驗年刊,39輯,頁79-103。
10. 吳天方(民86):我國師範大學工業教育學生學習風格之相關研究。教育研究資訊,5期,頁114-132。
11. 江芳盛(民86): 高雄市國民小學教師批判思考教學行為之研究。國立臺灣師範大學教育研究所集刊,第33期,頁247-258。
12. 陳密桃(民82):師範生批判思考的相關因素及其教學效果之分析研究。國立高雄師大教育學系及教育研究所,教育學刊,第10期,頁105-128。
13. 陳儀璇(民85):國中補校成人學生批判思考之研究。社會教育學刊,第25期:頁253-272 。
14. 陳麗華(民78):國小社會科批判思考教學的省思。現代教育,第15期,頁121-135。
15. 黃玉枝(民80):國中資優生與普通學生學習風格及學校適應之比較研究。特殊教育研究學刊,第9期,頁249-276。