(18.210.12.229) 您好!臺灣時間:2021/03/05 12:58
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:張育昊
研究生(外文):Yu-Hao Chang
論文名稱:利用KNN局部平均法於不分聲調之中文母音辨識
論文名稱(外文):Using the method of local mean to recognize Mandarin vowel without tones
指導教授:李宗寶
口試委員:郭仁泰邱國欽
口試日期:2017-06-28
學位類別:碩士
校院名稱:國立中興大學
系所名稱:統計學研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2017
畢業學年度:105
語文別:中文
論文頁數:25
中文關鍵詞:改進局部平均法K最近鄰居法K-means演算法梅爾倒頻譜係數
外文關鍵詞:Improved local-mean methodK-nearest neighbor methodK-means methodMel-frequency cepstrum coefficient
相關次數:
  • 被引用被引用:0
  • 點閱點閱:93
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本篇論文主要探討不同語者對於1391個中文單音的母音辨識,辨識流程主要有三個步驟,第一個步驟為前處理,將錄製好的聲音進行數位取樣、常態化、端點偵測、切割音框、預強調、視窗化,第二個步驟為特徵求取,將前處理完的語音訊號經過離散傅立葉轉換、三角濾波器、頻率範圍、對數能量、離散餘弦轉換得到梅爾倒頻譜係數,第三步驟將得到的梅爾倒頻譜係數使用K最近鄰居法、K-means分群法與改進局部平均法分別進行辨識,最後得到的最高辨識率為使用改進局部平均法的92.74%的辨識率,最低的辨識率為使用K-means分群法的89.13%。
The aim of this paper is to discuss the recognition of mandarin vowel using 1391 mandarin consonant words by different speakers. The recognition process can mainly separate into three parts. First, we make the vocal data doing fore-process, analog signal to digital signal、normallize、endpoint detecting、frame cutting、pre-emphasis and windowing. Second, we use discrete Fourier transform、triangular bandpass filters、frequency range、log energy、discrete cosine transform to get the Mel-scale frequency cepstral coefficients(MFCC). Third, we use KNN、K-means and improved local mean, three method to recognize. Finally, we got highest recognition rate with 92.74% by using improved local mean method and lowest recognition rate with 89.13% by using K-means algorithm.
摘要 i
Abstrast ii
目錄 iii
附圖目錄 v
附表目錄 vi
第一章 緒論 1
1.1 研究動機 1
1.2 專有名詞介紹 1
1.2.1 子音 1
1.2.2 母音 1
1.2.3 特定語者 1
1.2.4 非特定語者 1
1.3 語音的特性 2
1.4 相關文獻 2
1.5 論文架構 3
第二章 語音訊號前處理及特徵值求取 4
2.1前言 4
2.2 語音訊號前處理 5
2.2.1 數位取樣 5
2.2.2 常態化 6
2.2.3 端點偵測 7
2.2.4切割音框 8
2.2.5預強調 8
2.2.6 視窗化 9
2.3 特徵值求取 10
2.3.1 梅爾倒頻譜係數(MFCC) 10
2.3.2 離散傅立葉轉換(discrete Fourier transform) 11
2.3.3三角濾波器 11
2.3.4 頻率範圍 13
2.3.5對數能量 13
2.3.6離散餘弦轉換 13
第三章 方法與辨識流程 14
3.1前言 14
3.2方法介紹 14
3.2.1 K最近鄰居法 14
3.2.2 K-means演算法 15
3.2.3 改進局部平均法 17
3.3辨識流程 18
3.3.1 K最近鄰居法辨識流程 18
3.3.2 K-means演算法辨識流程 18
3.3.3改進局部平均法辨識流程 18
第四章 實驗結果 20
4.1 操作介面 20
4.2 參數設定 20
4.3 語音來源 20
4.4實驗結果 20
第五章 結論及未來展望 24
參考文獻 25
[1] M. Mohri, F. Pereira and M. Riley (2002),“Weighted finite-state transducers in speech recognition,” Computer Speech and Language, vol. 20, no. 1, pp. 69-88.
[2] A.M. de Lima Araújo and F. Violaro (1998),“Formant frequency estimation using a Mel scale Lpc algorithm,” in: Proceedings of Telecommunications Symposium 1, pp. 207-212.
[3] A. Ahad, A. Fayyaz and T. Mehmood(2002),“Speech recognition using multilayer perceptron,” in Proc. of the IEEE Conference ISCON’02, vol. 1, pp. 103-109.
[4] S. Masmoudi, M. Chtourou and A. B. Hamida(2009),“Isolated word recognition system using MLP neural network constructive tranning algorithm,” Systems, Signals and Devices. SSD ’09. 6th International Multi-Conference on , vol., no., pp.1,6, 23-26.
[5] B. Zhang and H. Pan(2013),“Reliable classification of vehicle logos by an improved local-mean based classifier,” In Proc. International Congress on Image and Signal Processing, pp.17-180.
[6] 王小川(2004),“語音訊號處理”。台北市:全華。
[7] 王國榮(2000),“Visual Basic 6.0 實戰講座”。台北市:旗標。
電子全文 電子全文(本篇電子全文限研究生所屬學校校內系統及IP範圍內開放)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔