資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽
|
首頁
|
關於本站
|
聯絡我們
|
國圖首頁
|
常見問題
|
操作說明
English
|
FB 專頁
|
Mobile
免費會員
登入
|
註冊
切換版面粉紅色
切換版面綠色
切換版面橘色
切換版面淡藍色
切換版面黃色
切換版面藍色
功能切換導覽列
(216.73.216.17) 您好!臺灣時間:2025/09/03 01:15
字體大小:
字級大小SCRIPT,如您的瀏覽器不支援,IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,如為IE7或Firefoxy瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
字體大小變更功能,需開啟瀏覽器的JAVASCRIPT功能
:::
詳目顯示
recordfocus
第 1 筆 / 共 1 筆
/1
頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
QR Code
本論文永久網址
:
複製永久網址
Twitter
研究生:
江瑋生
研究生(外文):
Wei-Sheng Jiang
論文名稱:
國語、義大利語及波斯語三語言語音辨識系統之設計研究
論文名稱(外文):
A Design of Trilingual Speech Recognition System for Chinese, Italian and Farsi
指導教授:
陳志堅
指導教授(外文):
Chih-Chien Chen
學位類別:
碩士
校院名稱:
國立中山大學
系所名稱:
電機工程學系研究所
學門:
工程學門
學類:
電資工程學類
論文種類:
學術論文
論文出版年:
2012
畢業學年度:
100
語文別:
中文
論文頁數:
61
中文關鍵詞:
語音辨識
、
線性預估倒頻譜係數
、
梅爾頻率倒頻譜係數
、
音位結構學
、
隱藏式馬可夫模型
外文關鍵詞:
Speech recognition
、
Linear predicted cepstral coefficients
、
Hidden Markov model
、
Mel-frequency cepstral coefficients
、
Phonotactics
相關次數:
被引用:0
點閱:301
評分:
下載:10
書目收藏:0
中國、義大利與伊朗,這三個在語言、歷史、文化與經濟,看似差異頗大的國家,其實其相互間的交流,早就存在。公元四世紀時,統一中國北方的北魏王朝,與位於今日伊朗的波斯帝國,建立了緊密的經貿聯繫。考古學家經由近年北魏出土銀碗的外觀及材質判知,其與今日存於伊朗的薩珊式波斯銀器,極為相似。由此可知,當時中國與波斯雙方經貿往來之盛行。另外在公元十三世紀,中國的元朝時,義大利旅遊冒險家兼商人馬可波羅,來到東方的中國,帶回許多中國的器物,並寫下傳世著作「馬可波羅遊記」,述說當時中國的美好與進步,是今日中義雙邊往來之濫觴。現代東方社會所喜愛的亞曼尼西裝和法拉利跑車,均產於義大利,代表著亞歐間經貿文化交流的結果。因此,吾人希望建立一套三語言之語音辨識系統,能對國語、義大利語和波斯語之學習,能產生實質的助益。
本論文之語音辨識系統,運用線性預估倒頻譜係數和梅爾頻率倒頻譜係數,來作單音節雙特徵參數之萃取,再經隱藏式馬可夫模型之候選單音排序,最後以音位結構學之比對,來挑選出最佳的辨識結果。國語以錄製一輪2,699筆二字詞的方式,來作單音節訓練之依據;義大利語和波斯語,則使用了陰平與去聲兩類單音,共五輪十次的策略,來作訓練。針對82,000筆國語語詞、27,900筆義大利語詞與4,000筆波斯語詞之資料庫,本實作系統之語詞正確辨識率,可分別達到87.54%、87.48%與90.33%。而平均辨識時間,約在1.5秒之內。吾人運用上述訓練架構,建置一套三語言之辨識系統,各選取100筆各個語言之常用語詞,對此300筆資料做語言別及語詞正確之判定,系統辨識率可達98.67%,而平均辨識時間約為2秒。
China, Italy and Iran are seemingly quite different in language, history, culture and economy. However, there have been existed mutual interactions among these three countries during the past age. In the fourth century, the Chinese Northern Wei Dynasty established close relation with the Persian Empire, located in Iran today. Persian language is also called Farsi in her native name. The unearthed silver bowls from China in the recent years showed similar appearance and material with the Sassanid-Persian silverware of Iran. Archaeologists found that ancient China and Iran used to be close international trading partners. In the thirteenth century, Marco-Polo, an Italian travel adventurer and merchant, visited Chinese Yuan Dynasty, and wrote a marvelous book “The Travels of Marco-Polo”. Fantastic experiences in China were depicted in this journal, and these initiated the Sino-Italian relation in the early days. Armani suits and Ferrari super racers become the oriental passion to the Italy in the Modern China, and this may represent the achievement of Asian-European culture exchange. Therefore, it is our objective to design a trilingual speech recognition system to help us to learn Chinese, Italian and Farsi languages.
Linear predicted cepstral coefficients, Mel-frequency cepstral coefficients, hidden Markov model and phonotactics are used in this system as the two syllable feature models and the recognition model respectively. For the Chinese system, a 2,699 two-syllable words database is used as the training corpus. For the Italian and Farsi systems, a database of 10 utterances per mono-syllable is established by applying their pronunciation rules. These 10 utterances are collected through reading 5 rounds of the same mono-syllables twice with tone 1 and tone 4. The correct recognition rates of 87.54%, 87.48%, and 90.33% can be reached for the 82,000 Chinese, 27,900 Italian, and 4,000 Farsi phrase databases respectively. The computation time for each system is within 1.5 seconds. Furthermore, a trilingual language-speech recognition system for 300 common words, composed of 100 words from each language, is developed. A 98.67 % correct language-phrase recognition rate can be obtained with the computation time about 2 seconds.
論文審定書 i
誌謝 ii
摘要 iii
Abstract iv
目錄 v
圖次 vii
表次 viii
第一章 緒論 1
1.1 研究動機 1
1.2 研究方法 2
1.3 論文章節概要 3
第二章 三國語言語音學 4
2.1 國語 4
2.2 義大利語 6
2.2.1 字母表 8
2.2.2 母音與子音發音規則 9
2.2.3 發音的音節區分 14
2.2.4 重音符號與發音規則 15
2.3 波斯語 16
2.3.1 字母表 16
2.3.2 母音與子音發音規則 17
2.3.3 波斯文的特殊發音和符號 20
2.3.4 波斯文的音節和重音區分方式 21
第三章 語音辨識系統的流程架構 22
3.1 音節切割 23
3.1.1 能量(Energy) 23
3.1.2 越零率(Zero Crossing Rate) 24
3.1.3 線性預估係數誤差能量 24
3.2 語音訊號前處理過程 26
3.2.1 高頻預強調(Pre-Emphasis) 26
3.2.2 加視窗(Windowing)與取音框 26
3.3 特徵萃取流程 28
3.3.1 線性預估倒頻譜係數 28
3.3.2 梅爾頻率倒頻譜係數 30
3.4 隱藏式馬可夫模型 33
3.4.1 參數模型初始化 35
3.4.2 參數重估(Parameter Estimation) 36
第四章 語音辨識系統實作成果與辨識效能 42
4.1 國語辨識系統 42
4.2 義大利大詞彙辨識系統 44
4.3 波斯文小詞彙辨識系統 46
4.4 三國語言辨識系統 48
第五章 結論與未來展望 50
參考文獻 51
[1]維基百科,http://zh.wikipedia.org/
[2]林立樹,義大利史-西方文化的智庫,三民書局,2008。
[3]Nannini Alda 藤谷道夫原作, 鄭明德譯,義大利語入門,旺文社股份有限公司,1997。
[4]康華倫,初級義大利文文法,茂昌圖書有限公司,2004。
[5]Persian alphabet , http://en.wikipedia.org/wiki/Persian_alphabet
[6]Farsi Pronouns , http://mylanguages.org/farsi_pronouns.php
[7]王小川,語音訊號處理,台北:全華圖書,2004。
[8]X. Huang, A. Acero, and H.W. Hon, Spoken Language Processing, Prentice Hall, Taiwan, 2001
[9]義大利辦事處,http://www.italy.org.tw/Chinese/index.html/
[10]D''Orta, P. “A speech recognition system for the Italian language,” Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP ''87.pp. 841 – 843, Apr 1987
[11]Lee, C.H., Rabiner, L.R., Pieraccini, R. and Wilpon, J.G., “Acoustic Modeling for Large Vocabulary Speech Recognition,” Computer Speech and Language, pp. 127-165, 2009
[12]Rashedi, A, “Appropriate Farsi speech recognizer for commanding robots, ” IEEE 10th International Conference on Signal Processing (ICSP), pp. 573 – 576,2010
電子全文
國圖紙本論文
推文
當script無法執行時可按︰
推文
網路書籤
當script無法執行時可按︰
網路書籤
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
相關期刊
熱門點閱論文
1.
語音評分
2.
用隱藏式馬可夫方法於頻域特徵之國語數字辨識
3.
語音辨識與VisualBasic
4.
以隱藏式馬可夫模型、向量量化與語言文法為基礎的中文語音辨識系統
5.
中文語音資訊檢索─以音節為基礎之索引特徵、統計式檢索模型及進一步技術
6.
日文語音辨識系統之設計研究
7.
中文語音辨識系統增進辨識率之策略研究-以地址系統與二、三、四字詞系統為例
8.
以樹狀結構有效使用調適語料之語者調適技術
9.
英文語音辨識系統之設計研究
10.
以語音辨識做電梯控制
11.
語音特徵抽取方法對連續音辨認影響之研究
12.
語音識別應用於卡拉OK之選曲輸入
13.
中文關鍵語詞搜尋系統之設計研究
14.
語言辨識與檢索在中文口語處理之研究
15.
國語、客語及瑞典語三語言語音辨識系統之設計研究
無相關期刊
1.
國語、阿拉伯語及荷蘭語三語言語音辨識系統之設計研究
2.
國語、英語及越南語三語言語音辨識系統之設計研究
3.
國語、土耳其語及塔米爾語三語言語音辨識系統之設計研究
4.
國語、俄語及泰語三語言語音辨識系統之設計研究
5.
國語、客語及瑞典語三語言語音辨識系統之設計研究
6.
國語、台語及粵語三語言語音辨識系統之設計研究
7.
國語、葡萄牙語及印地語三語言語音辨識系統之設計研究
8.
基於前進選擇之特徵選取之流行音樂曲風辨識與分析
9.
基於單一影像之車輛偵測系統軟硬體設計
10.
活性污泥池之二甲基亞楓(DMSO)體積負荷與二甲基硫(DMS)轉化率之相關研究
11.
八速並排式汽車自動變速器之創新設計
12.
基於暗原色先驗及霧濃度偵測之影像除霧
13.
結合位元截斷法和查表式函數求值之座標旋轉單元產生器設計
14.
恆春半島環境水體中烷基苯酚聚乙氧基醇化合物含量之研究
15.
傳染病的社區特性:以高雄市登革熱為例
簡易查詢
|
進階查詢
|
熱門排行
|
我的研究室