跳到主要內容

臺灣博碩士論文加值系統

(98.84.18.52) 您好!臺灣時間:2024/10/15 04:40
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:吳秉洋
研究生(外文):Bing-Yang Wu
論文名稱:韓文語音辨識系統之設計研究
論文名稱(外文):A Design of Korean Speech Recognition System
指導教授:陳志堅陳志堅引用關係
指導教授(外文):Chih-Chien Chen
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程學系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2010
畢業學年度:98
語文別:中文
論文頁數:63
中文關鍵詞:隱藏式馬可夫模型線性預估倒頻譜係數梅爾倒頻譜係數
外文關鍵詞:Mel-frequency cepstral coefficientsLinear predictive cepstrum coefficientsHidden Markov model
相關次數:
  • 被引用被引用:0
  • 點閱點閱:375
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文探討韓文語音辨識系統之設計與實作策略,以韓文常用單音節之語音特徵,作為主要的訓練與辨識方式。運用韓語發音規則,每輪錄製二種不同音調之常用單音,五輪每個單音可得10次之聲紋特性來作訓練資料。系統採用梅爾倒頻譜係數與線性預估倒頻譜係數,來作特徵參數之萃取;運用隱藏式馬可夫模型,來作單音之辨識。在Pentium 2.4 GHz之個人電腦與Ubuntu 9.04作業系統下,針對4865個韓文語詞,吾人約可達到92.25%之正確辨識率,平均所需辨識時間約在1.5秒以內。
This thesis investigates the design and implementation strategies for a Korean speech recognition system. It utilizes the speech features of the common Korean mono-syllables as the major training and recognition methodology. A training database of 10 utterances per mono-syllable is established by applying Korean pronunciation rules. These 10 utterances are collected through reading 5 rounds of the same mono-syllables twice with different tones. The first pronounced pattern has high pitch of tone 1,while the second one has falling pitch of tone 4.Mel-frequency cepstral coefficients, linear predictive cepstrum coefficients, and hidden Markov model are used as the two feature models and the recognition model respectively. Under the Pentium 2.4 GHz personal computer and Ubuntu 9.04 operating system environment, a correct phrase recognition rate of 92.25% can be reached for a 4865 Korean phrase database. The average computation time for each phrase is about 1.5 seconds.
摘要 II
致謝 III
目錄 IV
圖目錄 VI
表目錄 VII

第一章 緒論 1
1-1 研究動機 1
1-2 研究方法 2
1-3 論文章節概要 3

第二章 韓文語音學基礎 4
2-1 韓文之字母 4
2-2 韓文之音節 6
2-3 韓文之文字 7
2-4 韓文之羅馬拼音 10

第三章 語音辨識系統的流程與數學架構 13
3-1 前處理流程 14
3-1-1 音節切割 14
3-1-2 語音訊號之前置處理 18
3-2 特徵萃取流程 20
3-2-1 線性預估倒頻譜係數 20
3-2-2 梅爾倒頻譜係數 22
3-3 隱藏式馬可夫模型介紹 26
3-4 隱藏式馬可夫模型之訓練 28
3-4-1 參數初始化 28
3-4-2 參數重估 31
3-5 維特比演算法 34





第四章 韓文語音辨識系統之訓練策略 36
4-1 硬體環境與軟體規範 36
4-2 模擬語詞數量 38
4-3 單音模型之訓練方式 40
4-3-1 辨識率與單音訓練次數之關係 40
4-3-2 單音訓練每次錄製不同個數之單音 42
4-3-3 每輪每次錄製兩個不同音調之單音 44

第五章 韓文語音辨識系統實作成果與辨識效能 47
5-1 韓文常用語詞辨識系統 47
5-2 韓文能力測驗檢定辨識系統 49
5-3 韓國地名辨識系統 51

第六章 結論與未來展望 54
6-1 結論 54
6-2 未來展望 54

參考文獻 56
[1] The Unicode Consortium,The Unicode Standard:Worldwide Character Encoding, Version 1.0,Addison-Wesley,1992.
[2] 吳俊榮,“中文二,三,四字詞語詞辨識系統之設計研究”,國立中山大學碩士論文,民國96年
[3] 陳孟揚,“日文語音辨識系統之設計研究”,國立中山大學碩士論文,民國98年
[4] 王 俊,韓語語音學,水牛圖書出版
[5] 簡江作,最新韓國語會話,國立編譯館,民國91年
[6] 王小川,語音訊號處理,全華圖書出版,民國93年
[7] 謝文廣,“中文語音辨識系統增進辨識率之策略研究以地址系統與二、三、四字詞系統為例”,國立中山大學碩士論文,民國98年
[8] Keiichi Tokuda, Takao Kobayashi, Takashi Masuko, and Satoshi Imai, “Mel-generalized cepstral analysis-A unified approach to speech spectral estimation”Proc.ICASSP,pp.1043-1046,1994.
[9] 賴昭榮,“中文語音辨識系統降低訓練量之策略研究-以地址系統與二、三、四字詞系統為例”,國立中山大學碩士論文,民國97年
[10] 蔡昀庭,“基於隱藏式馬可夫模型之中文語音合成系統”,國立清華大學碩士論文,民國98年
[11] 鄭鶴得,“中文二字語詞辨識系統之設計研究”,國立中山大學碩士論文,民國96年
[12] 周思源,“T3台語剖析樹語料庫與Brill詞類標記”,國立清華大學碩士論文,民國94年
[13] 韓國語能力考試 http://topik.or.kr/
[14] 韓國教育課程評價院 http://www.kice.re.kr/index.do
[15] 中華民國交通部觀光局 http://admin.taiwan.net.tw/
[16] 中文維基百科 http://zh.wikipedia.org/
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top