跳到主要內容

臺灣博碩士論文加值系統

(44.210.77.73) 您好!臺灣時間:2024/02/23 11:37
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:周承輝
研究生(外文):Chou, Cheng-Hui
論文名稱:非特定語者英文字母及中文數字之電話語音辨識系統
論文名稱(外文):Speaker Independent Recognition Systems for the English Alphabets and Mandarin Digits over Telephone Network
指導教授:王駿發
指導教授(外文):Wang Jhing-Fa
學位類別:碩士
校院名稱:國立成功大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1998
畢業學年度:86
語文別:中文
論文頁數:68
中文關鍵詞:隱藏式馬可夫模型一階動態規劃演算法
外文關鍵詞:Hidden Markov ModelOne Stage DP Algorithm
相關次數:
  • 被引用被引用:1
  • 點閱點閱:216
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
由於電話網路廣泛分佈在世界的每個角落,人們可以很容易的透過電
話服務做大量資訊的查詢或預約,因此透過電話網路之非特定語者連續語
音辨識技術,將提供人們更多方便且人性化的各項隹務,在這些服務系統
中,英文字母及中文連續數字辨識在其中佔了很重要的地位,因此實現一
套電話語音英文字母及中文連續數字辨識系統將是本論文研究的重點,本
論文也整合了此兩套辨識系統為電話語音身份證字號辨識系統。在辨識模
型之訓練方面,數字部份採用台灣之國語語音資料庫(MAT)中所錄製
的6622個數字做為訓練語料,英文字母則由實驗室透過電話錄製910個字
母做為訓練語料,並利用Segmental K-Means演算法訓練出10個數字隱藏
式馬可夫模型跟26個字母的隱藏式馬可夫模型,也訓練出10個數字的反隱
藏式馬可夫模型跟26個字母的反隱藏式馬可夫模型供驗證時所使用。
辨識方面,是將電話語音整段送入辨識器中進行辨識的工作,利用一階動
態規劃演算法加上限制隱藏式馬可夫模型之邊界轉移條件做多辨字少辨字
的處理,找出最佳路徑後,並使用反隱藏式馬可夫模型做驗證的工作,使
辨識結果更準確且可靠。身份證字號辨識系統還利用身份證字號規則進行
確認以提高辨識率。 實驗方面,英文字母部份使用1092個單音字母語
料進行辨識,加上驗證後也使辨識率從97.71%提升至98.35%,在中文連續
數字方面,總共使用741句數字串進行辨識,其中包含4000個數字,在進
行多辨字少辨字的處理後可使插入及刪除率由6.33%降至2.30%,對辨識結
果進行驗證後,也使字元辨識率由85.95%提升至94.78%,數字串辨識率也
由48.99%提升至77.60%,在身份證字號辨識方面,使用416句身份證字號
進行辨識,第一名的辨識率達75.24%。
The telephone network is widely distributed over each corner
of the world. People can easily inquire or reserve a variety of
information through the tele-phone services. So speaker
independent recognition technology over telephone networks can
offer more convenient services. The English alphabets and
connected Mandarin digits recognition play an important role.
The aim of this paper is to develop a telephone speech
recognition system for English alphabets and Mandarin digits. We
also integrate these two system into an ID number recognition
system. We use the Mandarin Across Taiwan(MAT) corpus which
includes 6622 Mandarin digits and record 910 English alphabets
via telephone from laboratory for training. The segmental K-
means algorithm is adopted to train 10 digit HMMs and 26
alphabet HMMs for recognition. In addition 10 digit and 26
alphabet anti-HMMs are also trained for verification. For
recognition, we use the one stage DP algorithm and restrict the
between-template transitionto decrease the insertion and
deletion problem. Then we apply anti-HMMs to verify the
recognition result. The ID number recognition system takes the
advantage of ID number checking rule to improve the correct
rate. For experimental evaluation, 1092 isolated English
alphabets are tested in alphabet recognition. After
verification, correct rate is improved from 97.71% to 98.35%. A
set of 741 Mandarin digits strings which includes 4000 digits is
tested in connected digit recognition. After dealing with
insertion and deletion problem, theinsertion and deletion error
rate is decreased from 6.33% to 2.30%. After verification, the
digit correct rate is improved from 85.95% to 94.78%, and the
string correct rate is also increased from 48.99% to 77.60%. We
use 416 ID number telephone speech strings for testing in the ID
number recognition, and the TOP 1 correct rate achieves 75.24%.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top