(3.236.100.86) 您好!臺灣時間:2021/05/06 15:11
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:謝文廣
研究生(外文):Wen-kuang Hsieh
論文名稱:中文語音辨識系統增進辨識率之策略研究-以地址系統與二、三、四字詞系統為例
論文名稱(外文):A Design of Recognition Rate Improving Strategy for Mandarin Speech Recognition System - A Case Study on Address Inputting System and Phrase Recognition System
指導教授:陳志堅陳志堅引用關係
指導教授(外文):Chih-Chien Chen
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程學系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:57
中文關鍵詞:自動聲調辨識隱藏式馬可夫模型梅爾頻率倒頻譜係數次音節模型線性預估倒頻譜係數語音辨識
外文關鍵詞:speech recognitionhidden Markov modelsub-syllable modelautomatic tone recognitionLPCCMFCC
相關次數:
  • 被引用被引用:3
  • 點閱點閱:269
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文主要針對中文語音辨識系統增進辨識率之策略,進行聲調自動偵測與子音自動校正的研究,並將其運用在中文地址系統與二、三、四字詞系統中。在聲調自動偵測方面,吾人經由統計分析中文四聲的聲學特徵分佈,約可自動在6分鐘內估計出四組參數來作為四聲辨識之模型,提升其聲調之正確辨識率,並免除手動調校所需約到8小時之冗長程序,加快聲調模型之訓練速度;在子音自動校正方面,吾人利用次音節模型來輔助子音以提升其子音辨識率,進而提升語詞辨識率。經實驗証實在不增加訓練量的前題下,經由自動偵測聲調及子音校正的策略,針對地址系統約18萬筆地名資料,吾人可獲得90%以上之正確辨識率。針對共11萬6千筆二、三、四字詞之中文語音辨識系統,吾人能將正確辨識率分別由約77%, 94%, 97.5%,提昇到約85%, 96%, 98%。
This thesis investigates the recognition rate improvement strategies for a Mandarin speech recognition system. Both automatic tone recognition and consonant correction schemes are studied and applied to the Mandarin address inputting system and the Mandarin 2, 3, 4-word phrase recognition systems. For automatic tone recognition scheme, the acoustic properties of the four tones in the Mandarin training database are estimated statistically by 4 sets of parameters within 6 minutes. These automatically generated parameters can greatly increase the tone recognition accuracy, and at the same time reduce the amount of time spent in the manual tone parameter adjustment, that is about 8 hours in general. For consonant correction scheme, the sub-syllable models are developed to enhance the consonant recognition accuracy, and hence further improve the overall correct rate for the whole Mandarin phrases. Experimental results indicate that over 90% correct rate can be achieved for the Mandarin address inputting system with 180 thousand place names by applying the above two schemes. Furthermore, the recognition rates for the Mandarin 2, 3, 4-word phrase recognition systems with 116 thousand phrases in total can be improved from 77%, 94% and 97.5%, to 85%, 96% and 98% respectively.
摘要 Ⅰ
致謝 Ⅱ
目錄 Ⅲ
圖目錄 Ⅵ
表目錄 Ⅶ
第1章 緒論 1
1-1 研究動機 1
1-2 研究方法、目的與基本架構 1
1-3 章節概要 5
第2章 語音辨識相關技術與系統架構之研究 6
2-1 音節切割 6
2-1-1 能量 6
2-1-2 過零率 7
2-1-3 線性預估係數誤差能量 7
2-2 特徵萃取 8
2-2-1 高頻預強調 8
2-2-2 加視窗與取音框 8
2-2-3 離散傅利葉轉換 9
2-2-4 梅爾頻率濾波器 9
2-2-5 離散餘弦轉換 10
2-2-6 差量倒頻譜係數 11
2-2-7 線性預估編碼 11
2-2-8 線性預估倒頻譜係數 12
第3章 語音模型的訓練與辨識流程 14
3-1 隱藏式馬可夫模型 14
3-2 隱藏式馬可夫的訓練 15
3-2-1 參數模型初始化 15
3-2-2 參數重估 17
3-3 隱藏式馬可夫的辨識程序 21
第4章 中文語音聲調自動辨識之研究 23
4-1 中文語音聲調簡介 23
4-2 中文變調規則 23
4-2-1 上聲的聲調 24
4-2-2 多音節上聲的變調 24
4-3 音高軌跡 25
4-4 音高模型建立 27
4-5 模擬測試 28
4-6 實驗結果 29
第五章 中文子音辨識之研究 34
5-1 中文子音簡介 34
5-2 中文子音端點偵測 36
5-2-1 能量 36
5-2-2 越零率 37
5-2-3 音框相關性係數 37
5-2-4 切割臨界值偵測 38
5-3 次音節的訓練與模擬 40
5-3-1 次音節訓練 41
5-3-2 子音模擬方法及模擬結果 41
第六章 地址辨識系統之介紹 44
6-1 資料庫來源介紹 44
6-2 系統輸入輸出介紹 44
6-3 系統模擬測試 45
第七章 結論、建議與未來展望 47
7-1 結論 47
7-2 建議與未來展望 48
參考文獻 49
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊
 
系統版面圖檔 系統版面圖檔