跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.80) 您好!臺灣時間:2025/01/15 08:13
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳冠宏
研究生(外文):Kuan-Hung Chen
論文名稱:應用動態規劃拜氏網路於中文子音辨認
論文名稱(外文):Using Dynamic Programming Bayesian Neural Network for Mandarin Consonant Recognition
指導教授:王駿發
指導教授(外文):Jhing-Fa Wang
學位類別:碩士
校院名稱:國立成功大學
系所名稱:電機工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1993
畢業學年度:81
語文別:中文
論文頁數:55
中文關鍵詞:動態規劃拜式網路差值倒頻譜時域特徵
外文關鍵詞:dynamic programming bayesian neural newtorkdelta cepstrumtime
相關次數:
  • 被引用被引用:1
  • 點閱點閱:175
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
在國內,中文語音的辨認已經有了不錯的成果,尤其是母音及聲調的辨認
,但是子音辨認卻因為有些子音音短、音的強度也較弱且不穩定,很難將
特徵擷取出來,造成子音的辨認率一直提不高,因此本論文就是針對子音
來作改善,從辨認方法與辨認特徵兩方面來著手。在辨認方法上來說,就
同一個音節的語音信號,在頻譜上會有些許的變化,而在時間軸上亦會有
失真。因此提出動態規劃拜氏網路來做為子音辨認的架構網路,它結合了
動態規劃模型與拜氏網路的兩種特性,可模擬語音訊號的動態特性和含蓋
頻譜上的變化。其次,特徵參數的選取對子音而言亦是非常重要的,我們
除了採用倒頻譜係數之外,更加入差值倒頻譜與時域特徵(平均能量與平
均過零率)來當作網路的輸入音框參數,有效的提高辨認率。由於中文單
音有一特性,必為子音接母音或是單獨母音等兩種形式,因此如果能將單
音的子音、母音分開,那麼辨認時就不用做 408次比對,而只要 38 個母
音和 22 個子音共 60 次的比對就可以,這對我們在做辨認時的計算量和
記憶體都可因此而大為降低,所以整個系統採用階層式的辨認方式。但是
要正確的運用階層式架構,則一定得要有一個演算法來切開子音母音,因
此我們利用中文子音母音的特性:母音含有週期性,而子音則沒有,提出
音高週期偵測演算法,能準確地斷開子音和母音,如此才能針對子音做一
些個別處理。在我們的實驗中,是以兩個人對408 個中文音節各唸七次,
其中四次為訓練資料庫,三次為辨認資料庫。經過一連串的實驗後,就第
一名而言,子音的平均辨認率為 87.59% ,而前五名的平均辨認率為
98.51% 。
Due to the low Mandarin consonant recognition rate , in this
thesis , a new recognition network named Dynamic
Programming Bayesian Neural Network is proposed to improve
the consonant recognition rate. In this network , we combine
the dynamic model and Bayesian network which will overcome
the problem of the dynamic feature of speech signal and
tolerate spectral pattern variation. Furthermore , since the
feature parameters selection is very important for consonant,
we use cepstrum coefficient , delta cepstrum coefficient and
time domain features such as energy and zero-crossing rate to
represent the feature of consonant . In this paper, a
hierarchical recognition scheme is used to reduce the matching
times to accelerate recognition speed. Consequently , the
number of candidates can be reduced from 408 to 64 , i.e. , 4
lexicals , 38 vowels ,22 consonants. We use a segmentation
algorithm to segment the connected speech into syllables , and
each syllables is then segmented into vowel and consonant
parts . For experimental evaluation,we build a database
composed of two males , each one utters 408 Mandarin syllables
seven times . Four of them are used as training patterns and
three for testing patterns . After a series of experiments ,
the top one recognition rate of 87.59% is achieved and the
top five recognition rate is 98.51% in average .
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top