跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.84) 您好!臺灣時間:2024/12/14 21:37
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:賴彥君
研究生(外文):Lai, Steven
論文名稱:河佬語入聲字的分析與識別
論文名稱(外文):The Fundamental Analysis and Comparative Experiments for Highly Confusing Abrupt-Tone Syllables of Taiwanese Hokkian
指導教授:邱創乾邱創乾引用關係
指導教授(外文):Chiu, Chuang Chien
學位類別:碩士
校院名稱:逢甲大學
系所名稱:自動控制工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1995
畢業學年度:83
語文別:英文
論文頁數:60
中文關鍵詞:河佬語台語閩南語語音識別語音分析入聲
外文關鍵詞:TaiwaneseTaiwanese HokkianSpeech RecognitionSpeech
相關次數:
  • 被引用被引用:0
  • 點閱點閱:206
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:4
河佬語為台灣主要語言之一,它含有獨特的語音特性,發展河佬語的語音
識別系統,除在實務應用上極具潛力之外,對語音研究也構成一有趣而值
得探討的問題。比較河佬語及目前識別技術發展相當成熟的北京話,以及
考慮已經存有的語音技術,我們選擇入聲字的研究作為本文的重心,及未
來和佬語語音辨識系統的基礎研究,因為除了它是辨識河佬語不可或缺的
一環外,又是較少被探討的課題,同時在它的語音特性上尚有一些特殊的
問題,必須先加以釐清。本文的目的在透過一系列對於入聲字語音特性的
觀察及分析,界定入聲字的性質,再決定識別的方法及特徵選取的依據,
並進行識別實驗,由特定語者再推廣到非特定語者的語音識別。由頻域的
分析,我們可以發現終結位置的意義,主要是對前置的母音造成變形的效
果,但不致於構成一個獨立的音素,所以,辨識應以整個音節為單位,再
者,觀察終結位置對母音造成的影響,在高頻部份較為明顯,因此,我們
提出一種類似一種倒頻譜參數( mel- Cepstrum )的特徵取法,不同於
傳統以1K赫茲為界線,上下各取十個頻帶的做法,我們將其修改為1K赫
茲,以下取5個頻帶,以上則取15的頻帶, 此外,我們又另取了三組在語
音識別研究中最常用到的特徵參數:LPC、 cepstrum、mel-cepstrum,來
作為比較,同時挑選了具有代表性的37個音節,它們涵蓋了所有非鼻音類
母音和終結位置的組合,同時包括對應的非入聲音節。在非特定語者語音
識別,整體的辨識率最佳可達到70%(第一順位)87%(第二順位),若僅
就入聲音節而言,則是65%(第一順位)82.8%(第二順位),Cepstrum表
現最佳,它與除了LPC以外的兩組參數的辨識率比較,相差不超過3%。

This research is focused on resolving the speech recognition
pro blem for highly confusing abrupt-tone syllables of
Taiwanese Hokkian. A series of analytic experiments are
implemented to investigate certain characteristics of abrupt-
tone syllables in Taiwanese Hokkian. From the spectral
analysis, it can be conclu- ded that the ending part of abrupt-
tone syllables represents not an individual phoneme,but an
shifting version of non-abrupt-tone one. There are totally 37
syllables containing abrupt-tone and non-abrupt-tone sets being
selected for the recognition experi- ments. Different features
including cepstrum, mel-cepstrum, and LPC code with HMM models
for these confusing syllables from a speaker-dependent to a
speaker-independent mode are used to test the recognition
performance. Also, a new feature called modified mel-cepstrum
with emphasis in the band of 1K to 4K Hz is applied to the
experiments. At best,the speaker-independent recognition rate
for the whole database is over70%. the top two recognition
rates can improve to 87%. For abrupt-tone syllables only, the
recognition rate is about 65% for top one, and 82.8% for top
two. The new feature of modified mel-cepstrum performs well in
a speaker-independent mode with 81.6% top two recognition rate
in comparison with 79.2% of mel-cepstrum. In a summary,
cepstrum outperforms the other three features for the
recognition of the abrupt-tone syllables in Taiwanese Hokkian,
but the difference with mel-cepstrum or modified mel-cepstrum
is less than 3%.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊