(3.237.97.64) 您好!臺灣時間:2021/03/04 13:51
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:蔡財祿
研究生(外文):Tsai, Tsai-Lu
論文名稱:國客雙語語音辨認
論文名稱(外文):A Study on Mixed Hakka-Mandarin Chinese Bilingual Speech Recognition
指導教授:陳信宏陳信宏引用關係
指導教授(外文):Chen, Sin-Horng
學位類別:碩士
校院名稱:國立交通大學
系所名稱:電信工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2010
畢業學年度:98
語文別:中文
論文頁數:61
中文關鍵詞:語音辨認語言模型聲學模型客語國語
外文關鍵詞:speech recognitionlanguage modelacoustic modelHakkaMandarin
相關次數:
  • 被引用被引用:0
  • 點閱點閱:237
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:38
  • 收藏至我的研究室書目清單書目收藏:0
本論文進行客語與國客雙語的語音辨認研究,重點在於如何在極有限的客語文字資料限制下,訓練一個較可靠的語言模型。在客語語音辨認上,我們首先使用客語文字資料直接訓練出一個簡單的語言模型,接著使用詞類資訊(part of speech, POS)及國客語之間的詞條對譯資訊來協助改善客語語言模型。在雙語的語音辨認上,我們嘗詴兩種方法來產生雙語聲學模型,一種是直接將國語及客語的聲學模型合併,另一種是使用相似度量測來定義音素間的距離,用以合併國客語音素成一個共用的音素集,再訓練出一個混合的雙語聲學模型。實驗結果顯示我們所提出的聲學模型與語言模型對於客語及國客雙語語音辨認效能皆有所改進。
A first study on Hakka and mixed Hakka-Mandarin speech recognition (SR) is reported in this thesis. The main focus of the study is on solving the problem of the lack of a large text corpus for training a reliable language model. In the Hakka SR, several methods to use the information of part of speech and Hakka-Chinese word translation to assist in language modeling are proposed. For mixed language SR, a method to train a mixed Hakka-Mandarin acoustic model is suggested. Experimental results show that the proposed language and acoustic modeling approaches are promising for Hakka and mixed Hakka-Mandarin SR.
第一章 緒論 1
1.1研究動機 1
1.2研究方向 1
1.3相關研究 2
1.3.1聲學模型之相關研究 2
1.3.2語言模型之相關研究 2
1.4章節大要 3
第二章 實驗語料介紹 4
2.1語音語料庫介紹 4
2.1.1國語語音語料庫 4
2.1.2客語語音語料庫 5
2.1.3國客雙語語音語料庫 5
2.2文字語料庫介紹 6
2.2.1 國語文字語料庫 6
2.2.2客語文字語料庫 6
2.3 客語與國語之間的語文特性 8
2.3.1客語與國語的平行語料分析 8
2.3.2客語與國語的詞類分析 10
第三章 聲學模型 12
3.1訓練語料及測試語料 12
3.2聲學模型之建立 13
3.2.1 特徵參數抽取 13
3.2.2 單語聲學模型之建立 13
3.2.3 雙語聲學模型之建立 14
3.3雙語音素集 14
3.3.1 單語音素集 15
3.3.2音素直接合併 16
3.3.3 log-likelihood measurement 16
第四章 語言模型的設計 20
4.1 概論 20
4.2語言模型基本定義 20
4.2.1 N連語言模型 20
4.2.2語言模型平滑法 22
4.2.3語言模型評估準則-混淆度(perplexity, PP) 22
4.3客語語言模型 23
4.3.1基本客語語言模型 23
4.3.2強化客語語言模型 23
4.3.2.1由客語詞類資訊建立語言模型(Stage1) 24
4.3.2.2由國語詞類資訊建立語言模型(Stage2) 26
4.3.2.3由國語語言模型資訊建立語言模型(Stage3) 29
4.4雙語語言模型 30
4.5比較與效能分析 31
第五章 實驗結果及討論 33
5.1聲學模型實驗 33
5.2客語語言模型實驗 35
5.3雙語語音辨認實驗 39
第六章 結論與未來展望 43
6.1結論 43
6.2未來展望 43
參考文獻 44
附錄一:詞類標記 46
附錄二:決策問題 47
附錄三:音節結構表 50

【1】 Hsin-Min Yu, Lie-Shih Lo, Hsin-Te Hwang, His-Chun Hsiao, and Sin-Horng Chen, “On Constructing Speech Corpus for Implementing Hakka Text-To-Speech Synthesis,” OCOCOSDA, Dec. 2007.
【2】 Dau-Cheng Lyn, Chun-Nan Dau-Cheng Lyu, Chun-Nan Hsu, Yuang-Chin Chiang and Ren-Yuan Lyu, “Acoustic Model Optimization for Multilingual Speech Recognition,” Computational Linguistics and Chinese Language Processing, Vol. 13, No. 3, September 2008, pp. 363-386.
【3】 Hakka Television Service Online, available at http://www.hakkatv.org.tw/
【4】 Formosa Hakka Radio Online, available at http://www.formosahakka.org.tw/
【5】 J. Köhler, “Multilingual phone models for vocabulary independent speech recognition task,” Speech Communication, Vol. 35(1-2), pp. 21-30, 2001.
【6】 B. H. Juang, L. R. Rabiner, “A probabilistic distance measure for hidden Markov model,” Bell System Technical Journal, 64(2), pp. 391-408, 1985.
【7】 J. Kohler, “Multilingual phone models for vocabulary-independent speech recognition tasks,” vol. 35, nos. 1-2, pp. 21-30, 2001.
【8】 S. Yu, S. Zhang, and B. Xu, “Chinese-English bilingual phone modeling for cross-Language speech recognition,” ICASSP, 2004.
【9】 Joyce Y. C. Chan, P. C. Ching, Tan Lee and Houwei Cao, “Automatic speech recognition of Cantonese-English code-mixing utterances,” INTERSPEECH, 2006.
【10】 Hirofumi Yamamoto1,3, Genichiro Kikui2, Satoshi Nakamura1,2 and Yoshinori Sagisaka, “ Speech Recognition of Foreign Out-of-Vocabulary Words using Ahierarchical Language model,” INTERSPEECH,2006.
【11】 龔萬灶,2004,“臺灣客家文學選集小說” 。
【12】 Sinorama magazine, available at http://dblink.ncl.edu.tw/sinorama/index.htm.
【13】 Chen, Kuang-hua and Chen, Hsin-His, 2004, Overview of CIRB030 Information Retrieval Test Collection, avialable at http://lips.lis.ntu.edu.tw/cirb/index.htm.
【14】 Chen, Keh-jiann, Shing-Huan Liu,”Word Identification for Mandarin Chinese Sentences,”Proceedings COLING '92, pp.101-105, Nantes, France,1992.
【15】 鍾榮富,2004,“台灣客家語音導論”,五南圖書出版股份有限公司。
【16】 S. Young, D. Kershaw, J. Odell, D. Ollason, V. Valtchev, and P.Woodland, The HTK Book Version 3.0. Cambridge, U.K.: Cambridge Univ. Press, 2000.

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 李麗珍、陳淑滿(2005)。不同性別、獎學金等級選手知覺教練領導行為與內在動機之研究。臺灣運動心理學報,6,55-69。
2. 吳國銑(2000)。我國大專院校運動教練領行為比較研究。體育學報,28輯,59-68。
3. 詹淑月、游能揚、郭國隆、黃碧月、廖智雄(2003)。國中排球教練領導行為之研究。文化體育學刊,1,89-100。
4. 陳景星(2006)。教練領導哲學。國民體育季刊,35(3),82-85頁。
5. 何全進(2002)。教練領導行為、運動動機與滿意度之相關研究。教育科學期刊,1(2),99-117。
6. 王元聖(2005)。之專院校跆拳道教練領導行為與甲組跆拳道選手滿意度關係。淡江體育,9,51-59。
7. 鄭志富、蕭嘉惠、牟鍾福(1997)。運動領導量表(中文版)編製研究。臺灣師大體育研究,3,101-120。
8. 王耀聰(2005)。男女田徑選手知覺教練領導行為與運動樂趣來源之相關研究。大專體育學刊,7(3),127-140。
9. 陳彥君、劉志華(2003)。我國運動教練領導行為之探討。大專體育,69,44-48。
10. 鄭志富(1995)。運動教練領導行為研究去向。國民體育季刊,26(2),82-90。
11. 徐慶帆(2007)。從華人家長式領導談運動教練領導行為。中華體育,21(1),51-58。
12. 蔡崇濱(1997)。啟蒙教練的專業倫理。國民體育季刊,26(4), 29-35。
13. 蔣憶德、陳淑滿、葉志仙(2001)。教練領導行為與團隊凝聚力之相關研究。體育學報,30,195-206。
14. 39. 黃運金、李榮貴「應用SDBR提升生產績效」機械工業雜誌 , 292期, p.136~147,2007
15. 劉美玲、王佩蓮(2003)。以繪本為媒介進行環境議題教學之研究。環境教育學刊, 2, 93-122。
 
系統版面圖檔 系統版面圖檔