跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.106) 您好!臺灣時間:2026/04/04 22:39
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:王進文
研究生(外文):Jing-Wen Wang
論文名稱:探討線性預估編碼倒頻譜之特徵擷取對母音之影響
論文名稱(外文):The Investigation of Vowel Recognition for the Linear Predict Coding Cepstrum Coefficient Feature
指導教授:李宗寶
口試委員:郭仁泰邱國欽
口試日期:2011-06-14
學位類別:碩士
校院名稱:國立中興大學
系所名稱:統計學研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2011
畢業學年度:99
語文別:中文
論文頁數:53
中文關鍵詞:線性預估編碼倒頻譜參數
外文關鍵詞:Linear Prediction CodingCepstrum Coefficient
相關次數:
  • 被引用被引用:0
  • 點閱點閱:147
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本篇論文主要是探討線性預估編碼倒頻譜之特徵參數擷取對337個國字單音的母音辨識之影響。首先將337個國語單字分別錄製十次,將其存置資料庫中。錄完之後,針對語音作前處理,再求取其特徵參數。
本實驗利用此方法,進行特定語者的語音辨識,而實驗針對337個國字單音本人最高可達到95.95%的辨識率,七人之平均辨識率為97.83%。最後再針對一些可以改進辨識率的方法提供建議。


This paper is mainly to discuss the vowel recognition of 337 isolated mandarin words based on the feature of the linear predict cepstrum coefficient. At first, we record the 337 isolated mandarin words ten times. After recording, we do the pre-processing on our speech database by using the linear prediction coding to obtain the cepstrum coefficient features. The method of K-near neighbor is used for the speaker-dependent recognition. From the experimental result, the average highest recognition rate is 95.95% for 337 isolated mandarin words.

摘要 i
Abstract ii
目錄 iii
圖目錄 vi
表目錄 vii
第一章 緒論 1
1.1 研究語音辨識的動機與目的 1
1.2 語音辨識的研究範圍 1
1.2.1 語音的字彙數目 2
1.2.2 語音的發音方式 2
1.2.3 語音的語者差異 2
1.2.4 語音模型的建立方法 3
1.3 語音辨識流程簡述 4
1.3.1 語音訊號的前處裡與求取特徵參數 4
1.3.2 音框的壓縮與擴張 7
1.3.3 語音辨識之前置作業 7
1.3.4 辨識比對 8
1.4 論文架構 9
第二章 語音訊號之前處理與特徵參數之求取 11
2.1 前言 11
2.2 語音訊號之前處理 11
2.2.1 語音之數位取樣 11
2.2.2 語音之常態化 13
2.2.3 語音之端點偵測 14
2.2.4 語音之切割音框 16
2.2.5 語音之預強調 16
2.2.6 語音之視窗化 16
2.3 語音之特徵函數求取 17
2.3.1 自相關函數 18
2.3.2 線性預估編碼( Linear Predict Coding ; LPC) 18
2.3.3 倒頻譜參數(Cepstrum Coefficient;CPT) 20
第三章 語音的模型建立和辨識方法 22
3.1 前言 22
3.2 語音音框的壓縮和擴張 22
3.2.1 語音音框的壓縮 22
3.2.2 語音音框的擴張 23
3.3 語音辨識之前置作業 24
3.3.1 母音分群 24
3.3.2 尋找最佳化的音框移動與權重值 24
3.4 語音的辨識流程 27
3.4.1 待測語音的處理 27
3.4.2 母音群的選取 28
第四章 實驗操作流程與實驗結果 30
4.1 語音操作介面 30
4.2 實驗流程 30
4.2.1 語音來源 31
4.2.2 影響辨識率的可能因子與參數 31
4.3 實驗辨識結果 32
第五章 結論與建議 39
參考文獻 41
附錄 43
附錄一:337個國語單字 43
附錄二:母音分群表 44
附錄三:337個國語單字辨識結果 47
附錄四:一到五聲辨識率 53


[1]王小川 (2004)。 “語音訊號處理”。台北市:全華。
[2]王國榮 (2000)。“Visual Basic 6.0 實戰講座”。台北市:旗標。
[3]吳明哲,黃世陽 (1998)。“Visual Basic 6.0 中文版學習範本”。台北市:松崗。
[4]陳明熒。“PC電腦語音辨認實作”。 台北市:旗標書局,1994。
[5]李蕙珺,李宗寶 (2009)。“利用權重式第K位最鄰近方法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[6]張國清,李宗寶 (2005)。“用K-means之動態時間軸校正法於國語數字之語音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[7]陳首鳴,李宗寶 (2009)。“利用權重式Multiple Common Vector於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[8]楊茗蕙,黎自奮 (2003),李宗寶。“用隱藏式馬可夫方法於頻域特徵之國語數字辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[9]歐陽杰璋,李宗寶 (2010)。“利用音框移動之比較法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[10]羅璟義,李宗寶 (2009)。“利用權重式共同向量法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[11]籃元隆,李宗寶 (2009)。“利用權重式多重KNN法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
[12] Cover, T. M. and Hart, P. E. (1967). “Nearest neighbor Pattern Classification”, IEEE Trans. On Information Theory, vol. 13, No. 1, pp. 21-27.
[13] Gulmezoglu, M. B., Dzhafarov, V. and Barkana, A. (1999). “A novel
approach to isolated word recognition”, IEEE Trans. On Speech and Audio Processing, vol. 7, No. 6, pp. 620-627.
[14] Gulmezoglu, M. B., Dzhafarov, V. and Barkana, A. (2001). “The common vector approach and its relation to principal component analysis”, IEEE Trans. On Speech and Audio Processing, vol. 9, No. 6, pp. 655-662.
[15] Higgins, A. L., Bahler, L. G.. and Porter, J. E. (1993). “Voice identification using nearest-neighbor distance measure”, ICASSP, vol. 2, pp. 375-378.
[16] Tran, T. N., Wehrens, R. and Buydens, L. M. C. (2006). “KNN-kernel density-based clustering for high-dimensional multivariate data”, Computational Statistics and Data Analysis, vol. 51, pp. 513-525.


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top