(3.237.97.64) 您好!臺灣時間:2021/03/03 07:48
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:杜秋娟
研究生(外文):Chiu-chuan Tu
論文名稱:十萬個中文人名語音辨識系統之設計研究
論文名稱(外文):A design of speech recognition system for one hundred thousand Chinese names
指導教授:陳志堅陳志堅引用關係
指導教授(外文):Chih-Chien Chen
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程學系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:48
中文關鍵詞:隱藏式馬可夫模型端點偵測梅爾倒頻譜係數
外文關鍵詞:MFCCEndpoint detectionHidden Markov Model
相關次數:
  • 被引用被引用:2
  • 點閱點閱:156
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文的主要目的,在針對十萬筆中文人名之語音辨識系統,進行設計與實作。系統運用梅爾倒頻譜係數、隱藏式馬可夫模型與語音文字比對策略,作人名候選之機制,並配合中文之聲調辨識,以提升最終結果之可靠度。

實驗證實在語者相依的情況下,透過四聲的正確分類與平衡的單音訓練兩策略,吾人約可獲得85%之正確辨識率。這個結果,比未使用上述兩策略之系統,約可增加8%之正確辨識率。整體語音辨識系統,在Intel Celeron 2.4 GHz之處理器與Red Hat Linux 9.0的運算環境下,中文人名之語音辨識,約可在2.0秒內完成。
The objective of this thesis is to design and implement a speech recognition system for one hundred thousand Chinese names. Mel frequency cepstrum coefficient, hidden Markov model and lexicon search strategy are utilized to choose the name candidates. Furthermore, a mandarin intonation technique is also incorporated into this system to increase the final speech recognition accuracy.

The experimental results indicate that for the speaker dependent case, an 85% correct rate can be achieved by use of the proposed intonation classification scheme and the balanced monosyllable training database. The above correct rate has an increase of 8% over the previous method without using these two techniques. Under Redhat Linux 9.0 environment, a mandarin name can be recognized within 2 seconds by the use of a computer with Intel Celeron 2.4 GHz CPU.
摘要I-II
致謝III
目錄IV-V
圖目錄VI
表目錄VII
第1章 緒論1
1-1 研究動機與目的1
1-2 研究方法2
1-3 章節概要2
第2章 語音訊號處理之基本技術3
2-1 語音辨識系統架構3
2-2 端點偵測(Endpoint Detection)4
2-2-1 能量(Energy)4
2-2-2 越零率(Zero Crossing Rate)5
2-3 視窗函數(Window Function)7
2-4 特徵萃取(Feature Extraction)8
2-4-1 線性預估倒頻譜係數10
2-4-2 梅爾倒頻譜係數(MFCC)11
2-5 隱藏式馬可夫模型(HMM)13
2-5-1 隱藏式馬可夫模型理論13
2-5-2 訓練系統(Training)15
2-5-3 測試系統(Testing)16
2-6 自相關函數(ACF,Autocorrelation Function)18
第3章 系統設計與實驗結果21
3-1 資料庫建立與規劃21
3-2 資料庫錄製方式23
3-3 系統說明24
3-4 系統架構28
3-5 系統相關參數設定34
3-6 驗證測試結果35
第4章 結論與討論37
4-1 結論37
4-2 討論38
參考文獻39
[1]鄭吉峰,“台灣地區中文地址語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。

[2]孫益君,“以PDA為平台之語音辨識應用系統開發”,中原大學資訊工程研究所碩士論文,民國92年7月。

[3]楊永泰,“隱藏式馬可夫模型應用於中文語音辨識之研究”,中原大學資訊工程研究所碩士論文,民國88年7月。

[4]王小川,“語音訊號處理”,全華科技圖書公司,民國93年。

[5]維基百科,http://zh.wikipedia.org/

[6]台灣概覽,http://twinfo.ncl.edu.tw/

[7]全國商工行政服務網,http://210.69.121.50/~doc/ce/cesc1110.html

[8]公開資訊觀測站,http://newmops.tse.com.tw/

[9]歌詞帝國,http://www.kikikoko.idv.tw/

[10]批踢踢實業坊,bbs://ptt.cc

[11]David S. Petruncio,Jr. and Mark A. Hasegawa-Johnson,“Evaluation of Various Features for Music Genre Classification with Hidden Markov Models”, ECE, March 2002.

[12]陳豫德,“中文人名語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。

[13]Lawrence Rabiner and Biing-Hwang Juang, "Fundamentals of Speech Recognition", N.J.: Prentice Hall, 1993.

[14]Ben Gold and Nelson Morgan, "Speech and Audio Signal Processing: Processing and Perception of Speech and Music", John Wiley & Sons, Inc. 2000.


[15]Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders” , John Wiley & Sons, Inc., 2003.

[16]Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models”, Proc. ICSI, April 1998.

[17]黃銘崇,“不特定語者語詞辨識系統之特徵設計”,國立中山大學電機工程研究所碩士論文,民國90年6月。

[18]鄭博文,“雜訊環境下語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。

[19]賴昭華,“不特定語者中量語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國91年7月。

[20]潘睿慈,“特定語者中文語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。

[21]廖蓋隆,羅竹風,范源主編,“中國人名大詞典”,上海辭書出版社出版 : 新華書店發行,1990年。

[22]國父全集編輯委員會編輯,“國父全集 補編”, 臺北市 : 近代中國出版 : 中央文物總經銷,民國78年。

[23]胡健國,“近代華人生卒簡歷表”,國史館印行,民國93年。

[24]王永志主編,“2006台灣名人錄”, 中央通訊社,2005年12月初版。

[25]大專院校一覽表,http://reg.aca.ntu.edu.tw/college/search/

[26]林維琦,“古今中外人名語音辨識系統之設計研究” ,國立中山大學電機工程研究所碩士論文,民國95年7月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔