(3.236.6.6) 您好!臺灣時間:2021/04/22 18:27
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:魏宏璋
研究生(外文):Hong-jhang Wei
論文名稱:中文地名語音辨識系統之設計研究
論文名稱(外文):A Design of Speech Recognition System for the Mandarin Toponyms
指導教授:陳志堅陳志堅引用關係
指導教授(外文):Chih-chien Chen
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程學系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2006
畢業學年度:94
語文別:中文
論文頁數:45
中文關鍵詞:聲調偵測機制隱藏式馬可夫模型中文單音節辨識
外文關鍵詞:Hidden Markov ModelSpeech recognition of mandarin monosyllablesPitch detection mechanism
相關次數:
  • 被引用被引用:0
  • 點閱點閱:121
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文的中文地名語音辨識系統建構在Red Hat Linux 9.0作業系統下,系統採用目前廣泛運用的語音辨識相關技術,包含了梅爾倒頻譜參數、線性預估編碼與隱藏式馬可夫模型。系統以單音節做為辨識基礎,針對容易混淆的情形,採用聲調辨識機制來修正最後結果。在語者特定的環境下,本系統的辨識率約為90%,辨識時間在1.5秒以內。
In this thesis, a Mandarin toponym speech recognition system is developed using MFCC, LPC and HMM under Red Hat Linux 9.0. The system is based on monosyllable HMM''s to select the initial toponym candidates, and its final classification result can be obtained by further pitch identification mechanisms. For speaker-dependent case, a 90% correct rate can be achieved approximately and the recognition process can be accomplished within 1.5 seconds on the average.
致謝 Ⅰ
摘要 Ⅲ
目錄 Ⅳ
圖表目錄 Ⅵ
第一章 緒論 1
1-1 研究動機與目的 1
1-2 研究方法簡介 2
1-3 章節概要 3
第二章 語音處理相關技術之研究 4
2-1 語音處理相關領域 4
2-2 語音辨識相關技術 6
2-2-1 端點偵測(Endpoint Detection) 6
2-2-2 能量(Energy) 6
2-2-3 越零率(Zero Crossing Rate) 6
2-2-4 最大相似比(Maximum Likelihood Rate) 8
2-3 視窗函數(Window Function) 9
2-4 特徵萃取(Feature Extraction) 10
2-4-1 線性預估編碼(Linear Predictive Coding) 10
2-4-2 倒頻譜係數(Cepstrum Coefficient) 13
2-4-3 梅爾倒頻譜係數(Mel-Frequency Cepstrum oefficients) 15
2-5 隱藏式馬可夫模型(Hidden Markov Model) 17
第三章 辨識系統設計 19
3-1 資料庫建立 19
3-2 注音符號處理 23
3-2-1 方法一 23
3-2-2 方法二 24
3-3 系統輸入介紹 25
3-4 系統架構 26
第四章 實驗結果 31
4-1 系統相關參數設定 31
4-2 實驗結果 31
4-3 錯誤分析與改善 33
4-3-1 錯誤分析 33
4-3-2 改善策略 34
第五章 結論與未來展望 36
參考文獻 37
[1]http://www.krysstal.com/spoken.html
[2]Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing: Processing and Perception of Speech and Music”, John Wiley & Sons. Inc. 2000.
[3]中國行政區劃網 http://www.xzqh.org/quhua/
[4]中華民國內政部民政司 http://www.moi.gov.tw/dca/regime02.asp
[5]Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, N.J.: Prentice Hail, 1993.
[6]Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition, vol.36 pp2713-2721, April 2003.
[7]L. R.Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proc, IEEE, vol.77, pp.257-286, Feb, 1989.
[8]Kazunaga Yoshida, Takao Watanabe and Shinji Koga,“Large vocabulary word recognition based on demi-syllable hidden markov model using samll amount of training data”, C&C Information Technology Research Laboratories, NEC Corporation, 4-1-1 Miyazaki, Miyamac-ku, Kawasaki213, JAPAN.
[9]Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003.
[10]王小川, “語音訊號處理”, 全華, 民國93年.
[11]潘睿慈, “特定語者中文語詞辨識系統之設計研究”, 國立中山大學電機電機工程研究所碩士論文, 民國94年7月.

[12]鄭吉峰, “台灣地區中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國94年7月.
[13]張慶勇,“中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月.
[14]鄭博文, “雜訊環境下語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[15]陳豫德, “中文人名語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[16]賴昭華, “不特定語者中量語詞辨識系統之設計研究,” 國立中山大電機工程研究所碩士論文, 民國91年7月.
[17]黃銘崇, “不特定語者語詞辨識系統之特徵設計,” 國立中山大學電機工程研究所碩士論文, 民國90年6月.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔