跳到主要內容

臺灣博碩士論文加值系統

(18.205.192.201) 您好!臺灣時間:2021/08/05 02:59
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:陳弘啟
研究生(外文):Hong-Ci Chen
論文名稱:資源受限運算環境下華英混雜語音辨識系統
論文名稱(外文):Resource-constrained Mandarin/English Mixed-Lingual Speech Recognition System
指導教授:洪維廷洪維廷引用關係
學位類別:碩士
校院名稱:元智大學
系所名稱:通訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:42
中文關鍵詞:關鍵詞萃取光束搜尋法垃圾模型
外文關鍵詞:Keyword SpottingBeam SearchGarbage Model
相關次數:
  • 被引用被引用:0
  • 點閱點閱:156
  • 評分評分:
  • 下載下載:1
  • 收藏至我的研究室書目清單書目收藏:0
本論文提出結合華語、英語語音模型進行混合關鍵詞辨識,並且於資源受限制的情況下進行全整數運算。我們將所處理過後的定點化特徵參數經過RASTA濾波器,成為定點化RASTA特徵參數。而針對關鍵詞詞彙結構的相關性,我們建立一個樹枝狀的搜尋架構,並且利用光束搜尋法,減少辨識語料中音框所需的音節節點,進而減少搜尋空間,並且維持一定的辨識率。
針對辨識語料所產生的華語、英語語音模型相似度分數差異,我們提出偏差補償值應用於英語模型,並提出改變前置詞搜尋機制。增加可忽略搜尋前置詞路徑與無關詞垃圾模型路徑,以因應使用者沒有按照使用規則說出定義內前置詞的情形,藉此測試對於主詞的辨識率。
The thesis presents the implementation techniques for Mandarin/English mixed-lingual speech recognition (SR) kernel under resource-constrained platforms. Among the issues and techniques we explore are:
1.To solve the misreading issue of the prefix word by a modified search mechanism with a garbage model.

2.To solve the likelihood-gap issue in Mandarin/English mixed-lingual SR:A likelihood compensation scheme is proposed for solving the likelihood-gap issue which is caused by different modeling resolutions between two languages.
中文摘要I
英文摘要II
誌謝III
目錄IV
圖目錄VI
第一章 序論1
1.1研究動機1
1.2文獻回顧2
1.3研究概述3
1.4論文大綱4
第二章 華英語混合辨識系統5
2.1簡介5
2.2特徵參數擷取6
2.3隱藏式馬可夫模型9
2.4詞典樹12
2.5光束搜尋法15
2.6光束搜尋法實做16
2.7華英語混合的關鍵詞萃取19
2.7.1關鍵詞模組20
2.7.2無關詞垃圾模型20
2.7.3關鍵詞萃取的排列21
2.8語音模型的偏差補償23
2.8.1華英語混合關鍵詞的偏差補償23
2.8.2無關詞垃圾模型的偏差補償24
2.9辨識流程25
第三章 實驗分析27
3.1實驗設備27
3.2特徵參數27
3.3華語與英語模型27
3.4訓練語料28
3.5測試語料28
3.6改變搜尋機制實驗29
3.7加入無關詞垃圾模型路徑實驗32
第四章 結論與未來展望37
參考文獻39
附錄A42
[1]Po-Yi Shih and Jhing-Fa Wang and Hsiao-Ping Lee and Hung-Jen Kai and Hung-Tzu Kao and Yuan-Ning Lin ,“Acoustic and Phoneme Modeling Based on Confusion Matrix for Ubiquitous Mixed-Language Speech Recognition,”in SUTC 2008 , 500-506.
[2]C. L. Huang and C-H Wu,“PHONE SET GENERATION BASED ON ACOUSTIC CONTEXTUAL ANALYSIS FOR MULTILINGUAL SPEECH RECOGNITION,”Department of Computer Science and Information Engineering, National Cheng Kung University, Taiwan, Taiwan, R.O.C. (2007).
[3]C. L. Huang and C-H Wu ,“Generation of Phonetic Units for mixed-Language Speech Recognition Based on Acoustic and Contextual Analysis,”Department of Computer Science and Information Engineering, National Cheng Kung University, Taiwan, Taiwan, R.O.C. (2007).
[4]遊山銳, 簡世傑等人,“中英文混雜關鍵詞萃取技術,”TEPS 2004, 66-79.
[5]A. L. Higgins and R. E. Wohlford,“Keyword recognition using template concatenation,”in ICASSP 1985, Vol. 10, 1233-1236.
[6]J. R. Rohilcek and W. Roukos and H. Gish,“Continuous Hidden Markov Models for Speaker Independent Word Spotting,”in ICASSP 1989 , 627-630.
[7]R. Rose and D. Paul,“A hidden Markov model based keyword recognition system,”in ICSAAP 1990, Vol. 1, 129-132.
[8]J. Caminero and C. de la Torre and L. Villarrubia and C. Martin and L. Hernandez,“On-line garbage modeling with discriminant analysis for utterance verification,”in ICSLP 1996, Vol. 4, 2111-2114.
[9]F. Soong and E. Huang ,“A tree-trellis based fast search for finding the n-best sentence hypotheses,”in ICASSP 1991, 705-708.
[10]X. Lingyun and D. Limin,“Efficient Viterbi beam search algorithm using dynamic pruning,”in ICOSP 2004, Vol. 1, 699-702.
[11]T.Svendsen and F.K. Soong and H. Pumhagen,“Optimizing baseforms for HMM-base speech recognition,”In Proceedings of EuroSpeech 1995, 783-786.
[12]林玄松,“Optimization of viterbi beam search in speech recognition and multilingual speech recognition,”碩士論文, 國立清華大學資訊工程研究所, 民國91年.
[13]蔡炎興,“A system for keyword spotting and speaker recognition,”碩士論文, 國立中央大學電機工程研究所, 民國92年.
[14]http://www.resco.net/pocketpc/audiorecorder/.
[15]H. C. Wang and F. Seide and C. Y. Tseng and L. S. Lee,“ MAT2000 – Design, collection, and validation on a Mandarin 2000-speaker telephone speech database,”in ICSLP 2000, Beijing.
[16]http://www.aclclp.org.tw/doc/eat_brief.pdf.
[17]H.Hermansky and N.Morgan,“RASTA processing of speech,”in IEEE Transactions SAP, Vol. 2, 578-589.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top