跳到主要內容

臺灣博碩士論文加值系統

(3.235.227.117) 您好!臺灣時間:2021/08/01 23:23
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:李勝義
研究生(外文):LI, SHENG YIH
論文名稱:中文語音辨識系統之設計研究
論文名稱(外文):A Design of Chinese Speech Recognition System
指導教授:陳志堅陳志堅引用關係
指導教授(外文):CHEN, CHIH-CHIEN
學位類別:碩士
校院名稱:國立中山大學
系所名稱:電機工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1994
畢業學年度:82
語文別:中文
論文頁數:64
中文關鍵詞:臨界頻帶適應性頻帶卡氏轉換子字區
外文關鍵詞:Critical BandAdaptive BandKarhunen-Loeve TransformSubword
相關次數:
  • 被引用被引用:0
  • 點閱點閱:88
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
在現今語音處理學科中,語音辨識是一項頗具挑戰性的研究領域,而發展
中文語音辨識系統則是提供國人在人機界面的溝通上另一種更自然的選擇
方式。在處理語音辨識的方法上,為了克服因中文字音的聲、韻母的音長
差異甚大且易混淆字音過多的困擾,以及傳統語音辨識上將聲、韻母分開
辨識所遭遇的切割難題,本論文提出另一種對中文獨立字音作切割的新方
式,它是以適應性頻帶的頻譜表示方式以及卡氏轉換的數學架構,將獨立
字音所屬音框中具有準靜態頻譜結構的區域分解成同一子字區;每個子字
區所屬音框的頻譜向量再經由卡氏轉換之後所得的特徵向量即為該子字區
的特徵參數,其中:第一個特徵向量代表該子字區的頻譜靜態特性,其餘
的特徵向量則分別代表不同階層的頻譜動態特性。根據實驗結果,以卡氏
轉換為基礎的子字區切割方式不但可以偵測聲、韻母的邊界,同時也可以
將頻譜結構較複雜的韻母作更分明顯的區分,由於各子字區所萃取的特徵
向量所描述的是不同階層的頻譜特性,而與輸入音長的大小無關,因此在
辨識過程中不需作時軸的調整。此一結果顯示了以卡氏轉換為基礎的語音
處理模式,確實具有發展中文語音辨識系統的潛力。

Speech recognition is one of the most important research in the
speech processing subject. Especially in designing Chinese
speech recognition system,it provides another more natural
choice for Chinese to communicate between man and and machine.
There are many difficulties when processing Chinese speech
signals, such as the large difference between the length of
vowel and consonant in an isolated word, and those confusing
words.To conquer these problems, the vowel and consonant will
be decomposed and will be discriminant individually by
tranditionl recognition method. But this still exists one
problem which the boundary of vowel and consonant is not
always clear. In this thesis, we use adaptive band
spectrum to segment an isolated word into which correspond to
regions of acoustic quasi stationarity in the spectral
envelop, and use the Karhunen-Loeve Transform(KLT) to
extract the feature of each acoustic subword. According to
the results of the experiments. The subword decomposition
method can not only detect the boundary between vowel and
consonant, but also can make advanced decomposition when the
spectral structure of the consonant is complex. Since the
eigenvector of each subword describe spectral characteristics
at different orders ,which has nothing to do with the speech
length, The time alignment is then not a necessary
procedure in this scheme, the results show that the speech
processing model based on KLT does have the potential
of developing a Chinese speech recognition system.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top