(3.238.249.17) 您好!臺灣時間:2021/04/14 13:47
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:許銘凱
研究生(外文):Ming-Kai Hsu
論文名稱:自動判斷演唱歌詞正確與否之方法研究
論文名稱(外文):Automatic Evaluation of the Correctness of the Lyrics Sung by Performers
指導教授:蔡偉和蔡偉和引用關係
口試委員:黃士嘉徐永煜黃文增
口試日期:2013-01-22
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:電腦與通訊研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:74
中文關鍵詞:歌詞確認歌唱評分語句確認隱藏式馬可夫模型
外文關鍵詞:sung lyrics verificationspeech utterance verificationsinging skill evaluationhidden Markov model
相關次數:
  • 被引用被引用:2
  • 點閱點閱:236
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文的目標在於設計一個自動系統,能夠判斷演唱歌詞之正確與否,進而做為歌唱評分的一項依據。我們先利用一個現有的語句確認系統來評估所給定的歌唱訊號是否符合所定義的演唱歌詞,亦即唱詞確認。但結果發現這種以語音資料所建立的語句確認系統並不適合用來處理歌唱訊號,意即系統無法區隔唱對歌詞與唱錯歌詞的訊號。探究其主因在於演唱時常因配合旋律的關係而將母音拉長,造成歌唱訊號與語音訊號存在明顯的差異。為了解決這種的問題,本論文提出母音壓縮法及母音裁剪法來改善系統。主要概念是將被拉長的母音變短,使之接近於語音訊號。經實驗測試,修改母音後可降低唱詞確認的錯誤率約2%-3%,使唱詞確認的效能趨向於說話語句確認的效能。

This thesis aims to develop an automatic system for accessing if the lyrics sung by a performer is correct or not, thereby providing a clue for singing skill evaluation. Our basis strategy is to use a well-established speech utterance verification system to determine if the sung lyrics match the given textual lyrics, which can be considered as a task of sung lyrics verification. However, our experiment results show that a speech utterance verification system cannot handle singing data well, mainly because of the significant differences between singing and speech. One of the major differences, which deteriorates the performance of a speech utterance verification system severely, is the lengthening of vowels in singing. To solve this problem, this work proposes two improved methods, namely, vowel shrinking and vowel decimation. Both of the methods aim to adjust the length of a vowel in singing to a normal length in speaking. Our experiment show that the proposed method can improve the performance of the previous sung lyrics verification system around 2%-3% in terms of error rate reduction.

摘要 i
ABSTRACT ii
誌謝 iii
目錄 iv
表目錄 vi
圖目錄 vii
第一章 緒論 1
1.1 研究動機與目的 1
1.1.1 研究動機 1
1.1.2 研究目的 2
1.2 相關研究 3
1.3 語音辨識研究範圍 4
1.4 語音辨識概要 5
1.5 章節概要 7
第二章 語音的前置處理及特徵值的求取 8
2.1 前言 8
2.2 語音的前置處理 9
2.2.1 數位取樣(Digital Sampling) 9
2.2.2 常態化(Normalize) 10
2.2.3 端點偵測(End-Point Detection) 11
2.2.4 音框化(Frame Blocking) 13
2.2.5 預強調(Pre-emphasis) 14
2.2.6 視窗化(Windowing) 15
2.3 特徵值的求取 16
2.3.1 快速傅利葉轉換(Fast Fourier Transform) 17
2.3.2 梅爾刻度三角帶通濾波器(Mel-Scale Triangular Band-Pass Filter) 17
第三章 語音學及對母音做調整 19
3.1 前言 19
3.2 語音學 20
3.2.1 人類的發音器官 20
3.2.2 發音語音學 20
3.2.3 聲學語音學 22
3.3 中文的語音特性 25
3.4 對母音做調整 27
3.4.1 母音壓縮法 28
3.4.2 母音裁剪法 29
第四章 語音的模型建立及語音的辨識方法 31
4.1 前言 31
4.2 隱藏式馬可夫模型 32
4.3 語音模型的建立 35
4.4 連續語音的辨識 38
第五章 K最近鄰法 39
5.1 前言 39
5.2 母音分群 39
5.3 母音偵測 40
5.4 K最近鄰法的辨識方法 41
5.5 K最近鄰法的辨識流程 43
5.6 音框的壓縮 44
第六章 實驗方法與結果 45
6.1 資料庫說明 45
6.2 實驗參數 45
6.3 實驗說明 46
6.3.1 測試情況 46
6.3.2 系統測試 49
6.4 實驗流程 50
6.4.1 利用原始音檔去做實驗 50
6.4.2 產生壓縮母音後音檔去做實驗 50
6.4.3 比較兩種音檔的差異性 51
6.5 實驗結果 52
第七章 結論與未來研究方法 56
7.1 結論 56
7.2 未來研究方向 57
參考文獻 58
附錄
A 中文歌曲清單 60
B 468個國語單字 61
C 母音分群表 62
D 總測試情況的累加圖結果 64
D1 唱歌 64
D2 講話 66
D3 錯誤 68
E 中英文字對照表 70

[1] 比爾蓋茲,擁抱未來,臺北:遠流出版事業股份有限公司,1996,第231頁。
[2] 洪怡鳴,自動歌唱評分方法之研究,碩士論文,國立臺北科技大學電腦與通訊研究所,臺北,2009。
[3] 黎欣捷,卡拉OK歌唱評分方法研究,碩士論文,國立臺北科技大學電腦與通訊研究所,臺北,2010。
[4] 湯士民,應用錯誤型態分析於英語發音輔助學習,碩士論文,國立成功大學資訊工程學系,臺南,2005。
[5] 蔡明怡,國語語音之發音變異分析及提昇辨識效能之發音模型,碩士論文,國立臺灣大學電信工程學研究所,臺北,2006。
[6] 王小川,語音訊號處理(修訂二版),臺北:全華圖書股份有限公司,2009,第12-15~12-35頁。
[7] 吳忠達,利用K最近鄰居方法以及最佳梅爾頻率倒頻譜係數之特徵辨識特定語者之中文單音,碩士論文,國立中興大學統計學研究所,臺中,2011。
[8] Witt,S.M. and Young, S.J. “Phone-level Pronunciation Scoring and Assessment for Interactive Language Learning”, Speech Communication 30, 2000, pp.95-108.
[9] Yasushi Tsubota, Tatsuya Kawahara, Masatake Dantsuji, “CALL System for Japanese Students of English Using Pronunciation Error Prediction and Formant Structure Estimation,” InSTILL, 2002.
[10] My ET,2011,網址:http://www.myet.com/MyETWeb/PersonalizedPage.aspx。
[11] T. Tanaka, “Karaoke scoring apparatus analyzing singing voice relative to melody data,” United States Patent, 1999, 5889224.
[12] 維基百科,2012,網址:http://zh.wikipedia.org/wiki/倒頻譜。
[13] J. R. Deller, J. G. Proakis, and J. H. Hansen, “Discrete time processing of speech signals,” Prentice Hall, NJ, 1993.
[14] 洪惟仁-語言文化工作者,2012,網址:http://www.uijin.idv.tw/doc/線上教學與學生作品/漢語語音與音韻/2講義教材/01語音學.pdf。
[15] J. L. Flanagan and R. M. Golden, “Phase Vocoder,” Bell Syst. Tech. J., 1966, 45:1493-1509.
[16] 魔鏡歌詞網,2010,網址:http://mojim.com/twzlistALL.htm。
[17] A. Martin, G. Doddington, T. Kamm, M. Ordowski, and M. Przybocki, “The DET curve in assessment of detection task performance,” In Proceedings of the European Conference on Speech Communication and Technology, 1997, pp.1895-1898.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔