資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽
|
首頁
|
關於本站
|
聯絡我們
|
國圖首頁
|
常見問題
|
操作說明
English
|
FB 專頁
|
Mobile
免費會員
登入
|
註冊
切換版面粉紅色
切換版面綠色
切換版面橘色
切換版面淡藍色
切換版面黃色
切換版面藍色
功能切換導覽列
(18.97.9.172) 您好!臺灣時間:2025/02/10 13:02
字體大小:
字級大小SCRIPT,如您的瀏覽器不支援,IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,如為IE7或Firefoxy瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
字體大小變更功能,需開啟瀏覽器的JAVASCRIPT功能
:::
詳目顯示
recordfocus
第 1 筆 / 共 1 筆
/1
頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
論文連結
QR Code
本論文永久網址
:
複製永久網址
Twitter
研究生:
施登富
研究生(外文):
Teng-Fu Shih
論文名稱:
利用權重式K最近鄰居法於中文單音辨識
論文名稱(外文):
The Mandarin monosyllable recognition by using the method of K-nearest neighbor with different weights
指導教授:
李宗寶
口試委員:
郭仁泰
、
邱國欽
口試日期:
2017-06-28
學位類別:
碩士
校院名稱:
國立中興大學
系所名稱:
統計學研究所
學門:
數學及統計學門
學類:
統計學類
論文種類:
學術論文
論文出版年:
2017
畢業學年度:
105
語文別:
中文
論文頁數:
36
中文關鍵詞:
權重式k最近鄰居法
、
梅爾頻率倒頻譜
外文關鍵詞:
K-nearest neighbor with different weights
、
MFCC
相關次數:
被引用:0
點閱:143
評分:
下載:7
書目收藏:0
本篇論文主要是探討非特定語者對於 1391 個中文單音在不分、分聲調、母音與子音之辨識率。實驗主要分成幾部分:第一將錄製好的語音資料進行前處理,第二利用梅爾頻率倒頻譜求取特徵值,第三建立語音模型並使用權重式K最近鄰居法,從中選出辨識率最好的組合,視為最佳結果。本次實驗的語音資料庫是由二十位不同語者錄製共278200個語音資料。本篇固定的特徵值維度為39,取樣點為256,子、母音音框分別為20、25。實驗結果發現,在同母音群中,母音、子音權重分別為7比3時,其母音辨識率最佳為95.10%。在同母音且同子音群中,母音、子音權重分別為7比3時,其母音辨識率為94.40%。在母音對再辨識子音方面,其母音辨識對的前提下辨識單音的辨識率為87.4%。而在同母音且同子音群中,母音、子音權重分別為5比5時,不分聲調單音辨識率為80.73%。
This paper mainly discusses the recognition rate of non-specific speakers for 1391 mandarin tones in non-tone, sub-tone, vowel and consonant.
The identification process is mainly divided into several parts: the first part of recorded voice data will be fore-processing, the second part of find the eigenvalue by Melton frequency cepstrum, the third part of building voice model and the use of K-nearest neighbor of different weights, select the most recognition rate as the result of optimization. The speech database of this experiment is composed of twenty different speakers, total of 278200 voice data. In this paper, it fixed dimension of eigenvalue is 39, the sampling point is 256, the consonant frame is 20 and vowel frame is 25. The experimental results show that the best consonant error and vowel error are obtained for each vowel group and multiply the weight, and the vowel recognition rate is 95.10% when the vowel and consonant weights are 7:3 respectively. In addition, in each mandarin to find the best consonant, vowel multiplied by the weight, when the vowel, consonant weights are 7: 3, the vowel recognition rate of 94.40%, and in each mandarin to find the best consonant, vowel multiplied by the weight, when the vowel, consonant weight are 5:5 non-tone best recognition rate of 80.73%.
摘要 i
Abstract ii
目錄 iii
附圖目錄 v
附表目錄 vi
第一章 緒論 1
1.1 研究動機與目的 1
1.2 語音辨識相關研究 1
1.3語音辨識名詞 2
1.4 論文架構 3
第二章 語音訊號處理與求特徵值 4
2.1前言 4
2.2 語音訊號前處理 5
2.2.1 數位取樣 5
2.2.2 常態化 6
2.2.3 端點偵測 7
2.2.4 切割音框 8
2.2.5 預強調 9
2.2.6 視窗化 9
2.3 特徵值的求取 11
2.3.1 離散傅立葉轉換(Discrete Fourier transform) 11
2.3.3 三角濾波器 12
2.3.4 頻率範圍 13
2.3.5 對數能量 14
2.3.6離散餘弦轉換 14
第三章 建立模型與辨識方法 15
3.1 前言 15
3.2 模型建立 15
3.2.1 分群 15
3.2.2 K最近鄰居法 16
3.3 辨識流程和方法 17
3.3.1 K最近鄰居法的辨識流程 17
第四章 實驗結果 20
4.1 操作介面 20
4.2 參數設定 20
4.3 語音資料來源 20
4.4 實驗結果 21
第五章 結論及未來展望 28
參考文獻 30
附錄 31
1.L. E. Baum, “A maximization technique occurring in the statistical analysis of probabilistic functions of markov chains.” Ann. Math. Statist., vol. 41, pp. 164–171, 1970.
2.R. Reddy, et al. “The SPHINX speech recognition system.” Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 1989 International Conference on. IEEE, 1989.
3.R. A. Shirvan, and E. tahami. “Voice Analysis for Detecting Parkinson’s Disease Using Genetic Algorithm and KNN Classification Method”. In Proceedings of the 18th Iranian Conference of Biomedical Engineering (ICBME), pp.278–283,2011.
4.Muda, Lindasalwa, Mumtaj Begam, and Irraivan Elamvazuthi. “Voice recognition algorithms using mel frequency cepstral coefficient (MFCC) and dynamic time warping (DTW) techniques.” arXiv preprint arXiv:1003.4083 (2010).
5.Lippmann, Richard P. “Review of neural networks for speech recognition.” Neural computation 1.1 (1989): 1-38.
6.J. Cooley, J. Tukey, 1965, “An algorithm for the machine calculation of complex Fourier series.” Mathematics of Computation, vol.19, No.90, pp.297-301.
7.王小川 (2004),“語音訊號處理”。台北市:全華。
8. 王國榮 (2000),“Visual Basic 6.0 實戰講座”。台北市:旗標。
電子全文
連結至畢業學校之論文網頁
點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
推文
當script無法執行時可按︰
推文
網路書籤
當script無法執行時可按︰
網路書籤
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
相關期刊
熱門點閱論文
無相關論文
無相關期刊
1.
探討K-means方法及K最近鄰居法於中文母音和單音之不分聲調辨識
2.
應用多層感知機類神經法於高混合度之中文母音辨識
3.
牛腸道中分離之乳酸桿菌作為益生菌之探討
4.
數位金融浪潮下,銀行業從業人員的轉型策略探討-以F銀行為例
5.
快速演算法對於縱式資料之穩健分群
6.
超音波處理乳酸菌對豆漿發酵之異黃酮轉化研究
7.
利用電動力技術結合PRB活化過硫酸鹽整治受五氯酚污染土壤
8.
公務人員工作壓力與休閒調適策略之研究:以臺中市區公所為例
9.
從英國學派觀點評析區域整合─以歐盟和東協為例。
10.
錸-188核醫藥物之分子影像、藥物動力學、輻射劑量及療效評估研究
11.
利用B-spline 計算 Monge-Amp`ere方程式
12.
運用ROIC規劃模具廠商的營運策略
13.
臺灣中小企業出口跨境電商模式研究探討
14.
業務人員特質與客戶購買意願之研究
15.
從兩岸跨境電商的角度看跨境合作與競爭-以奧詩蒂股份有限公司為例
簡易查詢
|
進階查詢
|
熱門排行
|
我的研究室