跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.62) 您好!臺灣時間:2025/11/17 07:28
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:鄭亞倫
研究生(外文):Ya-Lun Cheng
論文名稱:中文語音合成系統於Android嵌入式平台之實作
論文名稱(外文):The Implementation of Mandarin TTS on Android Platform
指導教授:葉政育
指導教授(外文):Cheng-Yu Yeh
學位類別:碩士
校院名稱:國立勤益科技大學
系所名稱:電機工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2011
畢業學年度:99
語文別:中文
論文頁數:82
中文關鍵詞:安卓語音合成韻律遞迴類神經網路
外文關鍵詞:AndroidText-To-SpeechprosodyRecurrent Neural Network
相關次數:
  • 被引用被引用:3
  • 點閱點閱:541
  • 評分評分:
  • 下載下載:45
  • 收藏至我的研究室書目清單書目收藏:0
本論文在Android的嵌入式系統上實作有聲電子書系統,可讓閱讀者以聽書取代看書。此系統的語音播放功能是使用中文語音合成系統。語音合成編程語言是由C++所建構而成的主要包含4個功能:文句分析、411個中文音節波形、RNN韻律產生器、PSOLA語音合成器等。使用中文411個音節波形作為語音庫,其容量小,較適合使用在嵌入式設備上。本論文使用DMA-6410XP嵌入式平台搭載的作業系統版本為Android 1.6版,而 Android它是以 Linux 為核心的 Android 行動平台,使用Java作為編程語言,為了使語音合成能夠應用在Android上,這裡是使用Android NDK來協調Java語言與C/C++等原生語言在Android應用程式上的開發。完成的系統僅需約5MB,經由實驗結果測試,可即時的進行語音合成處理,並且能合成出正確與清晰的語音。
In this paper, the Mandarin text-to-speech technique is employed to accomplish the implementation of voiced E-book on the Android platform. Since a transformation from the text of E-book to the corresponding speech, it makes the reading more effortless and relaxed. The text-to-speech(TTS) system, which consists of the text analysis, the recurrent neural network(RNN) based prosodic generator, the synthesis unit with 411 Chinese syllable waveforms, and the pitch-synchronous overlap and add (PSOLA) speech synthesizer, is the core of the system proposed and is implemented with C++ programming language. Then, the user interface of the system proposed is achieved by using the Java language. Finally, the experimental results confirm that the complete system with memory required of 5MB is able to provide the fluent and clear speech in real-time.
中文摘要 i
英文摘要 ii
致謝 iii
目錄 iv
圖目錄 vi
表目錄 viii
第一章 序論 1
1.1研究動機與目的 1
1.2研究背景 2
1.3論文架構 6
第二章 Android作業系統 7
2.1 Android簡介 7
2.1.1 開放式手持裝置聯盟 7
2.1.2 Android Market 9
2.1.3 Android版本演進 10
2.2 Android 系統架構 12
2.2.1 Linux Kernel 13
2.2.2 Libraries 14
2.2.3 Application Framework 16
2.2.4 Applications 16
第三章 中文語音合成系統 21
3.1文句分析 22
3.1.1 剖詞語標詞類 23
3.1.2 構詞 26
3.2頻譜分析產生器 28
3.3韻律分析產生器 29
3.4語音合成器 34

第四章 系統設計 36
4.1 Android平台 36
4.2硬體平台簡介 37
4.3軟體平台簡介 40
4.3.1 Eclipse 40
4.3.2 Android SDK 42
4.3.3 Android NDK 47
4.4系統簡介 49
4.5系統實作 51
4.5.1 語音合成系統程式分析 51
4.5.2 系統封裝 54
4.5.3 文字轉碼 57
4.5.4 應用介面 57
第五章 實驗結果 59
5.1系統效能分析 59
5.2合成波形分析 61
5.3語音品質分析 66
第六章 結論與未來展望 68
6.1結論 68
6.2未來展望 68
參考文獻 69
附錄 71

[1] International Data Corporation (IDC), http://www.idc.com.tw/research/detail.jsp?id=NDA=
[2] 柯維新,行動通訊運營因應Android開放式平台之發展策略探討,國立政治大學碩士論文,民國99年8月。
[3] The Microsoft Network 3C,http://3c.msn.com.tw/View.aspx?ArticleID=46747
[4] A. W. Black and N. Campbell, ”Optimising Selection of Units from Speech Databases for Concatenative Synthesis” , in Proc. of EUROSPEECH, pp. 581-584, Sep. 1995.
[5] J. R. Bellegarda, “Unit-Centric Feature Mapping for Inventory Pruning in Unit Selection Text-to-Speech Synthesis” , IEEE, Speech, and Language processing, vol. 16, no. 1,Jan 2008.
[6] Keiichi Tokuda, Heiga Zen, Junichi Yamagishi, Takashi Masuko, Shinji Sako, Alan W. Black, and Takashi Nose, “The HMM-based Speech Synthesis System (HTS),” http://hts.sp.nitech.ac.jp/ .
[7] 羅瑩,張智星,根基於HMM之華語語音合成初步研究,國立清華大學資訊工程學系碩士論文,民國98年。
[8] Wikipedia Android , http://zh.wikipedia.org/zh-hant/Google_Phone
[9] Android developers , http://developer.android.com/
[10] Open Handset Alliance , http://www.openhandsetalliance.com/
[11] 楊文誌,Google Android 2程式設計與應用,旗標出版股份有限公司,2009年11月。
[12] 長高科技股份有限公司,行動裝置嵌入式系統與軟體S3C6410 Google Android開發應用實務,2009年10月。
[13] Android Activity,
http://developer.android.com/reference/android/app/Activity.html
[14] S. H. Cheng, S. H. Hua, “A Chinese text-to-speech system,” in Proc. ICSLP, 1996.
[15] Wikipedia Viterbi algorithm , http://en.wikipedia.org/wiki/Viterbi_algorithm
[16] S. H. Chen,S. H. Hwang and Y. R. Wang,” An RNN-Based Prosodic Information Synthesizer for Mandarin Text-to-Speech” IEEE Transactions On Speech and Audio Processing,vol. 6, no. 3, MAY 1998.

[17] Neural Networks and Error Back propagation Learning,
http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/backprop/backprop-2009.html
[18] S. H. Chen,and Y. R. Wang,”Vector quantization of pitch information in Mandarin speech,”IEEE Trans. Communication, vol.COM-38, pp.1317-1320, 1990.
[19] E. Moulines, and F. Charpentier, "Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones," Speech Communication 9, pp.453-467, 1990.
[20] H. Valbret, E. Moulines, J.P. Tubach, "Voice transformation using PSOLA technique," ICASSP-92., IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 145 –148, 1992.
[21] “DMA-6410XP an operation manual,” Dmatek Co., Ltd, 2009.
[22] Eclipse , http://www.eclipse.org/downloads/
[23] 蓋索林,Google ! Android 2手機應用程式設計入門第3版,松崗資產管理股份有限公司,2009年12月。
[24] 王小川,語音訊號處理,全華科技圖書股份有限公司,民國93年3月。

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top