跳到主要內容

臺灣博碩士論文加值系統

(75.101.211.110) 您好!臺灣時間:2022/01/26 13:06
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:葉志強
研究生(外文):Chih-Chiang Yeh
論文名稱:音叉頻譜在母音辨識上之應用
指導教授:沈士育沈士育引用關係
指導教授(外文):Shih-Yu Shen
學位類別:碩士
校院名稱:國立成功大學
系所名稱:數學系應用數學碩博士班
學門:數學及統計學門
學類:數學學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:46
中文關鍵詞:母音辨識音叉頻譜
相關次數:
  • 被引用被引用:12
  • 點閱點閱:262
  • 評分評分:
  • 下載下載:42
  • 收藏至我的研究室書目清單書目收藏:1
在語音訊號中,母音是最主要的部分,因此在國音的辨識上,首要的目標即是能成功的辨識母音。而本論文的主要概念是以一連串不同共振頻率的音叉來模仿人耳的聽覺系統。首先將音叉的運動方式轉為數學模型,再經由數值解求出特徵參數後,經過辨識流程的前置處理與策略的分類,最後達到母音的辨識。在本方法中,經由實驗測試簡單母音,不分男女音,辨識率約95%,而複合韻母則為89%,就一個新發展之方法而言,辨識率相當高,值得繼續發展。
第一章 緒論 1
1.1 簡介 1
1.2 聲音之介紹 3
1.3 國音學概念 5
1.4 章節概要 9
第二章 理論分析 10
2.1 人耳系統與音叉特性 10
2.2 數學模型的架構 15
2.3 微分方程式之數值解 20
第三章 訊號處理與辨識流程 24
3.1 錄音與語音訊號蒐集 24
3.2 辨識流程之前置處理 27
3.3 辨識流程之辨識策略 32
第四章 實驗結果 40
4.1 實驗環境 40
4.2 實驗設計 41
4.3 實驗結果 42
第五章 總結 44
5.1 討論 44
5.2 建議 46
參考文獻 i

表 目 錄
編號 頁數
表1.1:聲音的分貝相關表...................................4
表1.2:國音聲母表.........................................6
表3.1:WAV檔案格式表.....................................25
表3.2:韻母可能的組合....................................37
表4.1:實驗一(單韻母)之結果..............................42
表4.2:實驗二(複合韻母)之結果............................42
表4.3:單韻母與複合韻母之總辨識率........................42


圖 目 錄
編號 頁數
圖2.1:人耳的周邊聽覺系統................................10
圖2.2:中耳、包括耳膜及三個小骨..........................11
圖2.3:中耳擴音作用原理一................................11
圖2.4:中耳擴音作用原理二. ..............................11
圖2.5:科蒂氏器..........................................12
圖2.6:音叉的構造........................................13
圖2.7:音叉振動與空氣分子間之關係........................13
圖2.8:頻率與音叉關係圖..................................14
圖2.9:微分方程式(Ⅰ)之圖解..............................16
圖2.10:微分方程式(Ⅲ)之圖解..............................17
圖3.1:Cooledit 2000錄音介面程式圖......................26
圖3.2:音叉的設定........................................28
圖3.3:語音之能量圖與起始點和結束點......................29
圖3.4:高斯分佈加權及平滑化之曲線圖......................30
圖3.5:母音ㄚ之統計圖....................................31
圖3.6:母音ㄩ之統計圖....................................31
圖3.7:初步分群圖........................................32
圖3.8:G1細分流程圖......................................33
圖3.9:G2細分流程圖......................................34
圖3.10:G3細分流程圖.....................................35
[1] E.Oran Brigham,“The Fast Fourier Transform and its Application”,Prentic-Hall International Editions,1988.
[2] Gordon E. Pelton,“Voice Processing”, McGraw-Hill Serier on Computer Communcations,1992.
[3] Lawrwnce Rabiner and Biing-Hwang Juang,“Fundamentals of Speech Recognition”,Prentice-Hall Inc.,New Jersey,1993.
[4] L.R Rabiner,“A tutorial on hidden Markov models and selseted application in speech recognition”, Proc. IEEE, vol. 77, pp.257-286, Feb. 1989.
[5] O'Shaughnessy and Douglas,“Speech communication : human and machine”, Addison-Wesley Pub. Co., 1987
[6] Sadaoki Furui,“Digital Speech Precessing,Synthesis, and Recognition”,Basel,Marcel Dekker Inc,New York,1989.
[7] 馬大猷/楊訓仁,“聲學漫談”, 牛頓,台北, 1996.
[8] 國立台灣師範大學國音教材編輯委員會編撰,“國音學”,正中書局, 台北, 1992.
[9] 張斌,“耳鼻喉科學”,臺初版, 正中書局, 台北, 1996.
[10] 陳明瑩,“PC 電腦餘音辨識實作”,初版,旗標出版社,台北, 1994.
[11] 黃介一,“時間域上中文語音辨識研究”, 國立成功大學應用數學研究所碩士論文, 1997.
[12] 楊永裕,“與說話者不關的母音辨識”, 國立成功大學應用數學研究所碩士論文, 1995.
[13] 劉康寰,“聲波與耳”,譯自:“Waves and the ear”,台灣商務,台北,1960.
[14] 薛正本,“樂器演奏中音符與節奏的辨識”, 國立成功大學應用數學研究所碩士論文, 2000.
[15] 羅志帆,“與說話者不關的中文韻母辨識”,國立成功大學應用數學研究所碩士論文, 1996.
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top