(3.92.96.236) 您好!臺灣時間:2021/05/09 00:35
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:陳永銘
研究生(外文):Yung-ming Chen
論文名稱:英文語音辨識系統之設計研究
論文名稱(外文):A Design of English Speech Recognition System
指導教授:陳志堅陳志堅引用關係
指導教授(外文):Chih-Chien Chen
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程學系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:60
中文關鍵詞:梅爾倒頻譜係數線性預估倒頻譜係數隱藏式馬可夫模型語音辨識
外文關鍵詞:Linear predicted cepstrum coefficientsHidden Markov modelMel frequency cepstrum coefficientsSpeech recognition
相關次數:
  • 被引用被引用:2
  • 點閱點閱:309
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文探討英文語音辨識系統之設計與實作策略,系統可以以英文字母拼字讀入的方式或直接唸英文單字的方式來作英文單字之口語輸入辨識與查詢。實作採用梅爾倒頻譜係數與線性預估倒頻譜係數來作特徵參數之萃取,運用隱藏式馬可夫模型來作聲音之辨識。在Pentium 1.6 GHz之個人電腦與Ubuntu 8.04作業系統下,針對11萬筆英文單字作拼字讀入辨識,吾人約可達到95%之正確辨識率;而針對1500個英文單字作直接唸英文單字作辨識,吾人亦可達到93%之正確辨識率,兩種輸入方式之平均所需辨識時間均約在1.5秒以內。
This thesis investigates the design and implementation strategies for a English speech recognition system. Two speech inputting methods, the spelling inputting and the reading inputting, are implemented for English word recognition and query. Mel-frequency cepstrum coefficients, linear predicted cepstrum coefficients, and hidden Markov model are used as the two feature models and the recognition model respectively. Under the Pentium 1.6 GHz personal computer and Ubuntu 8.04 operating system environment, a 95% correct recognition rate can be obtained for a 110 thousand English word database by the spelling inputting method; and a 93% correct recognition rate can be achieved for a 1,500 English word database by the reading inputting method. The average computation time for each word using either inputting method is about 1.5 seconds.
致謝I
摘要II
目錄III-V
圖目錄VI
表目錄VII
第一章 緒論1
1-1 研究動機1
1-2 研究目的及方法1
1-3 設計架構流程2
第二章 英文的起源及發音的介紹3
2-1 英文的介紹3
2-1-1 英文的歷史3
2-2 如何學英文發音5
2-2-1 美音和英音5
2-2-2 英文KK音標的符號介紹5
2-3 英文母音的介紹7
2-4 英文子音的介紹7
2-5 英文語音的分類8
2-6 KK音標符號的顯示問題9
2-7 字彙KK音標的收集與處理11
第三章 語音訊號處理介紹14
3-1 單位語詞及音節的切割14
3-1-1 音框能量與越零率14
3-1-2 線性預估誤差能量16
3-2 梅爾頻率倒頻譜係數16
3-2-1 預強調17
3-2-2 音框化17
3-2-3 漢明窗18
3-2-4 梅爾三角濾波器19
3-2-5 離散傅立葉轉換20
3-2-6 離散餘弦轉換20
3-3 線性預估係數21
3-3-1 線性預估倒頻譜參數22
第四章 語音訓練的模型24
4-1 隱藏式馬可夫模型24
4-2 維特比演算法26
第五章 英文語音辨識系統29
5-1 英文拼音辨識系統的介紹29
5-1-1 資料的收集與建立29
5-1-2 系統的設計方法30
5-1-3 字母比對流程34
5-1-4 系統架構圖35
5-1-5 訓練方式與辨識率之關係36
5-1-6 實驗結論41
5-1-7 隨機測試42
5-2 英文辨識系統的介紹43
5-2-1 資料的收集與建立43
5-2-2 系統的設計方法44
5-2-3 系統架構圖46
5-2-4 實驗結果47
5-2-5 實驗結論49
5-2-6 隨機測試50
第六章 未來展望51
參考文獻52
[1] 賴昭榮, “中文語音辨識系統降低訓練量之策略研究-以地址系統與二、三、四字詞系統為例”, 國立中山大學電機工程研究所碩士論文, 民國97年7月。
[2] 陳儒平, “中文語音辨識系統增進辨識率之策略研究-以人名系統與二、三、四字詞系統為例”, 國立中山大學電機工程研究所碩士論文, 民國97年7月。
[3] 吳俊榮, “中文二、三、四字語詞辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國96年7月。
[4] 吳銘鈞, “以音節為基礎之語者識別”, 國立清華大學資訊工程研究所碩士論文, 民國92年6月。
[5] 羅瑞麟, “以語者辨識與評分輔助口說英文學習”, 國立清華大學資訊工程研究所碩士論文, 民國93年6月。
[6] 美國人口調查局 http://www.census.gov/
[7] 楊煒仁, “K.K.音標教學”, 文鶴, 民國86年。
[8] 楊懿麗, “英語語音學”, 渤海堂, 民國83年。
[9] 黃正興, “英語發音(English Pronunciation)”, 三民, 民國87年
[10] 王小川, “語音訊號處理” , 全華, 民國96年。
[11] Xuedong Huang&Alex Acero&Hsiao-Wuen Hon, “SPOKEN LANGUAGE PROCESSING” , PEARSON , Jun 2005
[12] Konstantinos G. Derpanis, “Isolated English Letter Speech Recognition” , York University, Department of Computer Science and Engineering , April 5, 2004
[13] Carnegie Mellon University http://www.cmu.edu/index.shtml
[14] 台灣教育部 http://www.edu.tw/
[15] Phonetics:The Sounds of American English http://www.uiowa.edu/~acadtech/phonetics/english/frameset.html
[16] Phoneme Chart: English Vowel and Consonant Sounds http://www.btinternet.com/~ted.power/phon00.htm
[17] 維基百科 http://zh.wikipedia.org/w/index.php?title=%E8%8B%B1%E8%AF%AD&variant=zh-hant
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊
 
系統版面圖檔 系統版面圖檔