跳到主要內容

臺灣博碩士論文加值系統

(44.201.97.138) 您好!臺灣時間:2024/09/08 05:03
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:吳胤賢
研究生(外文):Yin-Shian Wu
論文名稱:台灣腔英語辨識系統之建立
論文名稱(外文):An Implementation of English across Taiwan Speech Recognition System
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Sin-Horng Chen
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
畢業學年度:96
語文別:中文
論文頁數:43
中文關鍵詞:英語辨識英文辨識語音辨識
外文關鍵詞:English recognitionspeech recognition
相關次數:
  • 被引用被引用:0
  • 點閱點閱:190
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,使用EAT語料庫中的麥克風語料,並參考CMU字典將音檔內容的單字標記轉換成音素標記,考慮前後文之間的相關性,建立以三聯音素為單位的隱藏式馬可夫模型,並以狀態為分享單位,用決策樹決定模型參數的共享。接著使用紐約時報(New York Times)當作語言模型的訓練語料,分別建立bigram與trigram語言模型,並對語言模型進行適當的調適,最後將調適過的語言模型加入到基本英語辨識系統中進行測試語料辨認,並比較使用語言模型前後辨識率的差異以及探討提升原因。使用本論文所建立的聲學模型進行音素辨識,可獲得49.75%的辨識率;進行單字辨識,未加入語言模型時,短句辨識率為35.52%,詞組辨識率為56.31%;加入bigram語言模型後,短句與詞組辨識率分別為56.14%與56.79%;加入triigram語言模型後,短句與詞組辨識率分別為60.23%與57.48%,由結果可看出語言模型幫助系統辨識率提升不少。
第一章 緒論.1
1.1 研究動機.........1
1.2 研究方向.........1
1.3 章節概要.........2
第二章 基本英語辨識系統.........4
2.1 語音語料介紹.4
2.1.1 語料內容介紹......4
2.1.2 訓練語料與測試語料選取..5
2.2 標音方式的選用..............6
2.3 基本模型單位的選用.....6
2.4 決策樹理論介紹.............8
2.4.1 問題集的選取......9
2.4.2 節點分裂的標準..9
2.5 基本辨識系統架構.......11
2.5.1 字典....11
2.5.1.1 音素字典.11
2.5.1.2 單字字典.11
2.5.2 特徵參數與模型11
2.5.3 使用音素標記語料內容....12
2.5.4 實驗結果與分析13
2.5.4.1 音素辨認率.............13
2.5.4.2 單字辨認率.............15
第三章 語言模型的設計...........18
3.1 概論...............18
3.2 語言模型的基本定義...18
3.2.1 N–gram 語言模型...........18
3.2.2 語言模型的smoothing....19
3.3 語言模型的文字訓練語料...........20
3.4 字典...............21
3.5 建立語言模型...............23
3.5.1 General LM 的建立............23
3.5.2 語言模型的調適23
3.5.3 語言模型的評估準則........25
3.6 語言模型的perplexity .25
第四章 實驗結果與討論...........28
4.1 使用調適後bigram 語言模型於語音辨識.28
4.2 使用調適後trigram 語言模型於語音辨識.31
4.3 結論...............33
第五章 結論與未來展望...........34
5.1 結論...............34
5.2 未來展望.......34
參考文獻.....36
附錄一.........37
附錄二.........38
【1】S.J. Young﹐“The general use of tying in phoneme-based HMM speech recognisers﹐”ICASSP﹐Vol 1﹐pp569-572﹐San Francisco﹒
【2】S.J. Young﹐G. Evermann﹐T. Hain﹐D. Kershaw﹐G. Moore﹐J. Odell﹐D. Ollan﹐D. Povey﹐V. Valtchev﹐P. Woodland﹐“The HTK Book(version 3.4)”
【3】P. Ladefoged﹐“A Course in Phonetics﹐fourth edition”
【4】http://ipa.16280.com/
【5】http://odin.prohosting.com/hkkim/cgi-bin/kaeps/ipa.htm
【6】http://cpk.auc.dk/~tb/articles/tim2spe98.htm
【7】http://ifla.uni-stuttgart.de/~jilka/teaching/introduction/s3_features.pdf
【8】 S.J. Young﹐J.J. Odell﹐P.C. Woodland﹐“Tree-based state tying for high accurary acoustic modelling﹐”In Proc.of the Human Language Technology Workshop﹐ pages307-312﹒Plainsboro﹐NJ﹐March﹐1994﹒
【9】K.F. Lee﹐H.W. Hon﹐“Speaker–Independent Phone Recognition Using Hidden Markov Models﹐”IEEE Trans. ASSP﹐37(11) ﹐1989.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top