跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2024/12/08 14:50
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:梁振豊
研究生(外文):Chen-Feng Liang
論文名稱:台語語音辨識及智慧型口語對話汽車導航系統
論文名稱(外文):Taiwanese Speech Recognition System and ITS Application
指導教授:王逸如王逸如引用關係
指導教授(外文):Dr.Yih-Ru Wang
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程系所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2006
畢業學年度:95
語文別:中文
論文頁數:56
中文關鍵詞:台語辨識
外文關鍵詞:Taiwaneserecognition
相關次數:
  • 被引用被引用:1
  • 點閱點閱:437
  • 評分評分:
  • 下載下載:100
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中建立了一個台語音節辨認器並且將之應用於一個實際應用系統-「慧型口語對話汽車導航系統」中。在論文中首先針對台語語音特性入聲調的部份深入研究,我們由confusion matrix去分析入聲調對辨識系統的影響性,且根據語言學上的知識修改文字拼音資料庫,使得訓練出來的聲學模型更為可靠,進而提升辨識率;並利用Kullback Leibler(KL) distance去觀察聲學模型在修改前與修改後之間的差異。同時論文中也將sub-syllable bigram 語言模型(Language Model)加入辨識系統中,使的辨識率得以提升。在論文最後把台語語音辨識系統應用在-「慧型口語對話汽車導航系統」。
In the thesis, a syllable recognition system for Taiwanese was established and applied to a real application - Intelligent Transportation System(ITS).
First , a syllable-based Taiwanese speech recognition system was implemented. And the effect on the recognition performance of the syllable with entering tone was carefully exiamined. Based on the linguistics knowledge, the syllable with entering tone in database was re-labeled according to the tone sandhi of Taiwanese in order to improve the recognition rate. In addition, Kullback Leibler distance between the acoustic model before and after re-labeling was examined to verify the linguistics knowledge. And the syllable bigram language model to the recognition system will obtain the rate improvement. Finally, the Taiwanese Speech Recognition System was applied to an Intelligent Transportation System(ITS)
目錄

中文摘要............................................................I
英文摘要...........................................................II
致謝..............................................................III
目錄...............................................................IV
表目錄.............................................................VI
圖目錄...........................................................VIII
第一章 緒論.........................................................1
1.1 研究動機....................................................1
1.2 研究方向....................................................1
1.3 章節概要....................................................2
第二章 台語語音特性.................................................3
2.1台語結構與分類..............................................3
2.2 入聲韻母變調規則............................................5
2.3 鼻化韻母特性與鼻音特徵的本質................................7
2.4 輕聲調的特性................................................8第三章 台語語音辨識................................................10
3.1 簡介.......................................................10
3.2 資料庫與現有資源介紹.......................................10
3.3 台語音節辨識系統基本架構...................................11
3.4 特徵參數擷取...............................................12
3.5 聲學模型...................................................13
3.6 辨識網路 ..................................................14
3.7 基本台語辨認系統之效能評計.................................14
第四章 台語入聲調特性分析與改進方法................................18
4.1 由confusion matrix分析台語入聲調..........................18
4.2 利用Kullback Leibler(KL)2 distance觀察入聲調...............25
4.3 添加語言模型至台語辨識器...................................29
4.3.1 語言模型簡介.........................................29
4.4 辨識結果比較...............................................30
第五章 智慧型口語對話汽車導航系統..................................32
5.1 系統簡介...................................................32
5.2 架設工具與系統內部功能簡介.................................32
5.3 辨認模型的架設與訓練.......................................35
5.3.1 Subsyllable HMMs......................................36
5.3.2 Background Model......................................36
5.3.3 語法架構.............................................36
第六章 結論與未來展望..............................................41
參考文獻...........................................................42











表目錄

表格2.1 漢語音節內部結構...........................................3
表格2.2 台語八聲例表...............................................4
表格2.3 口元音與鼻化元音...........................................7
表格2.4 口元音與鼻化元音的例句.....................................7
表格 3.1 語料的統計資料............................................11
表格3.2 特徵參數設定..............................................13
表格3.3 Outside test辨識率........................................14
表格3.4 Dictionary校正後辨認率....................................15
表格3.5 音檔校正後辨認率..........................................16
表格3.6 聲母辨認率................................................16
表格3.7 韻母辨認率................................................16
表格3.8 入聲韻母辨認率............................................16
表格4.1 入聲韻母與基本韻母之相互辨識關係一........................19
表格4.2 入聲韻母與基本韻母之相互辨識關係二........................20
表格4.3 入聲韻母與基本韻母之相互辨識關係三........................20
表格4.4 入聲韻母與基本韻母之相互辨識關係四........................21
表格4.5 入聲韻母與基本韻母之相互辨識關係五........................21
表格4.6 入聲韻母與基本韻母之相互辨識關係六........................22
表格4.7 入聲韻母與基本韻母之相互辨識關係七........................23
表格4.8 入聲韻母與基本韻母之相互辨識關係八........................23
表格4.9 修改促聲韻母後的辨識率....................................25
表格4.10 修改辨識網路後的辨識率...................................25
表格4.11 syllable database........................................31
表格4.12 Syllable unigram辨識率...................................31
表格4.13 Syllable Bigram辨識率....................................31
表格5.1特徵參數設定...............................................36
表格5.2 grammar架構...............................................37
表格5.3 19 speech acts in ITS Dialogue System.......................38
表格5.4 The 23 categories in ITS Dialogue System...................38




















圖目錄

圖 2.1 台語八聲調之基頻軌跡.........................................4
圖 3.1 語音音節辨識基本架構........................................11
圖 3.2 辨識網路....................................................14
圖4.1 train data修改情形..........................................24
圖4.2 Outside test data修改情形...................................24
圖4.3未根據變調規則修改之前HMM之間confusion的情況...............28
圖4.4根據變調規則修改之後HMM之間confusion的情況.................29
圖 4.5 Back-off bigram Word-Loop Network...........................30
圖 5.1 口語汽車導航系統方塊圖.....................................32
圖 5.2 由ATK架設的基本即時辨認器..................................33
圖 5.3 Galaxy Communicator software內部結構圖......................34
圖 5.4系統運作實例................................................39
參考文獻

【1】 陳珮玥,”台灣閩南語中首部動作特指「打」的語意探析”,第五屆漢語詞彙語意學術研討會論文集,新加坡,2004年6月。
【2】 王閔鴻,”不特定語者大辭彙華台雙語辨識引擎之研製及其應用”,私立長庚大學碩士論文,民國九十二年六月。
【3】 鄭良偉,”台語的語音與詞法”,遠流出版社,1997年
【4】 鍾榮富,”台語的語音基礎”,文鶴出版有限公司,2002年11月。
【5】 王文德,”台語語音辨識與文字處理之研究”,國立交通大學碩士論文,民國九十三年七月。
【6】 方南強,”台語通用會話:一套讓你能說出台語美辭雅語的教材,第二集”,開拓出版商,1997年。
【7】 鄭如玲,”一分鐘台語單字速成”,三思堂文化事業有限公司,2002年
【8】 S. Young,”A Review of Large-vocabulary Countinuous-speech Recognition”,IEEE Signal Processing Magazine,1996.
【9】 S. Young,G. Evermann,T. Hain,D. Kershaw,G. Moore,J. Odell,D. Ollason,D. Povey,V. Valtchev,P. Woodland,”The HTK book(for HTK version 3.3”
【10】 A. Seigler,Uday Jain,Bhiksha Raj,Richard . Stern,”Automatic Segmentation, Classification and Clustering of Broadcast News Audio”, ECE Department – Speech Group Carnegie Mellon University Pittsburgh, PA 15213
【11】 張榮勳,”國語廣播新聞語音基本辨認系統之建立”,國立交通大學碩士論文,民國九十四年七月。
【12】 蔡金翰,”語音對話系統和對話策略之研究”,國立交通大學碩士論文,民國九十四年七月。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top