(3.238.186.43) 您好!臺灣時間:2021/03/02 10:27
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:盛思豪
論文名稱:即時歌唱聲合成系統與音樂合成系統之整合
論文名稱(外文):Real-Time Singing Voice Synthesis System and Integration with Instrument-Sound Synthesus
指導教授:洪西進洪西進引用關係古鴻炎古鴻炎引用關係
學位類別:碩士
校院名稱:國立臺灣科技大學
系所名稱:電機工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:69
中文關鍵詞:歌唱合成音樂
外文關鍵詞:SingingSynthesisInstrument-Sound
相關次數:
  • 被引用被引用:6
  • 點閱點閱:393
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在近年來軟體科技的精進和積體電路的發展都有極快的進展,因此電腦的計算能力大幅的提升。而現在也有各式各樣的音樂合成系統能在電腦上製作音樂以及語音合成系統能使電腦說話。但以往語音合成的商業產品並不能產生歌唱聲,也沒有跟音樂合成系統做整合。所以我們主要是針對歌唱聲的語音合成方法和與音樂合成系統的整合作進一步的研究。最後我們將在最普遍的作業系統─windows實作一套能即時合成並播放的音樂、語音合成系統。
我們參考之前音樂合成系統的研究,利用其中的wavetable配合加法合成的合成法,可以得到清晰的音色與即時的處理,故延續著這方面繼續研究。我們已經能利用中文的409個基本樣本,以頻譜分析、內插的方式產生清晰的歌唱聲,就整體聆聽的感覺已經不會跟真人歌唱聲有很明顯的差異。所以我們決定朝這個方向努力,並嘗試與音樂混聲以期達到虛擬演唱的效果。
Owing to the rapidly growing software techniques and the development of VLSI, the compute ability of computers substantially raised. Various music synthesizers can produce music and voice synthesizer can make computer talk. However, the appliances of music synthesizer cannot produce human singing, either integrate with music synthesizer. In this proposal, we will focus on the methods of singing voice synthesizer integrate with the music, then a real time compose and play music synthesizer will be implemented on the PC under the most popular operation system, Windows.
According to the previous research, we found that the music synthesizer based on the wavetable method coordinate with the additive method could produce distinct tone and real time disposal; therefore, we develop our project upon this method. We can use 409 basic Chinese samples to produce fidelity song by the way of spectrum analyze and interpolation method. The tone of the synthesized does not have notable difference with the tone sung by a real man. Consequently, we will make our effort toward this direction, and try to create virtual singing voice by using mix synthesize songs and singing voice.
摘要 I
ABSTRACT II
致 謝 III
目 錄 IV
圖 表 索 引 VII
第一章 緒論 1
1.1 研究動機及目的 1
1.2 論文方法概要 4
1.3章節大要 6
第二章 語音合成所使用的方法以及音樂合成系統的介紹 7
2.1語音合成的相關技術探討 7
2.1.1時域上的語音合成方法簡介 7
2.1.2頻域上的語音合成方法簡介 12
2.2本論文所整合的音樂合成系統架構 15
第三章 歌唱聲音的合成 31
3.1 本論文所採用之演算法基本概念 31
3.2 與說話合成系統、音樂合成系統的差異 33
3.3 演算法的詳細處理過程 35
3.3.1收集樣本庫 35
3.3.2樂譜的制訂 35
3.3.3樣本切割 35
3.3.4頻率分析 38
3.3.5抖音的削減 41
3.3.6調整各區段頻譜的音長、音高及轉折音的處理 42
3.3.7抖音的加入 45
3.3.8波形的合成及頻譜的平滑化(smoothing) 45
第四章 系統實作 50
4.1 收集樣本庫 50
4.2 樣本的切割 50
4.3 頻率分析 51
4.4 抖音的削減 52
4.5 調整各區段頻譜的音長、音高及轉折音的處理 53
4.6 波形的合成及頻譜的平滑化(smoothing) 58
4.7 與音樂系統之整合 60
第五章 實驗評估與結論 63
5.1 測試方法與結果 63
5.2 實驗數據分析 65
5.3 結論 66
[1] M.W. Macon; M.A. Clements, “Speech concatenation and synthesis using an overlap-add sinusoidal model”, Acoustics, Speech, and Signal Processing, 1996. ICASSP-96. Conference Proceedings., 1996 IEEE International Conference on , Volume: 1 , 1996 Page(s): 361 -364 vol. 1
[2] M.W.Macon; L. Jensen-Link; J. Oliverio; M.A. Clements; E.B. George, “A singing voice synthesis system based on sinusoidal modeling,” Acoustics, Speech, and Signal Processing, 1997. ICASSP-97., 1997 IEEE International Conference on , Volume: 1 , 1997 Page(s): 435 -438 vol.1
[3] M.W.Macon;M.A. Clements, “Sinusoidal modeling and modification of unvoiced speech,” Speech and Audio Processing, IEEE Transactions on , Volume: 5 Issue: 6 , Nov. 1997 Page(s): 557 —560
[4] M.W. Macon; A.McCree; Wai-Ming Lai; V. Viswanathan, “Efficient analysis-synthesis of percussion musical instrument sounds using an all-pole model,” Acoustics, Speech and Signal Processing, 1998. Proceedings of the 1998 IEEE International Conference on , Volume: 6 , 1998 Page(s): 3589 -3592 vol.6
[5] A. Kain ; M.W. Macon, “Spectral voice conversion for text-to-speech synthesis,” Acoustics, Speech and Signal Processing, 1998. Proceedings of the 1998 IEEE International Conference on , Volume: 1 , 1998 Page(s): 285 -288 vol.1
[6] J. Wouters ; M.W. Macon, “Spectral modification for concatenative speech synthesis,” Acoustics, Speech, and Signal Processing, 2000. ICASSP ''''00. Proceedings. 2000 IEEE International Conference on , Volume: 2 , 2000 Page(s): II941 -II944 vol.2
[7] J. Wouters ; M.W. Macon, “Control of spectral dynamics in concatenative speech synthesis,” Speech and Audio Processing, IEEE Transactions on , Volume: 9 Issue: 1 , Jan. 2001 Page(s): 30 —38
[8] Q.T. Zhang,; H.S. Miao, “A generalized normalization technique for signal detection in nonstationary correlated noise,” Acoustics, Speech, and Signal Processing, 1992. ICASSP-92., 1992 IEEE International Conference on , Volume: 2 , 1992 Page(s): 465 -468 vol.2
[9] R. Di Federico; C. Drioli, “An integrated system for analysis-modification-resynthesis of singing,” Systems, Man, and Cybernetics, 1998. 1998 IEEE International Conference on , Volume: 2 , 1998 Page(s): 1254 -1259 vol.2
[10] I. Arroabarren; M. Zivanovic; J. Bretos;A. Ezcurra; A. Carlosena, “Measurement of vibrato in lyric singers,” Instrumentation and Measurement Technology Conference, 2001. IMTC 2001. Proceedings of the 18th IEEE , Volume: 3 , 2001 Page(s): 1529 -1534 vol.3
[11] T.F. Quatieri; R.J. McAulay, “Shape invariant time-scale and pitch modification of speech,” Signal Processing, IEEE Transactions on , Volume: 40 Issue: 3 , March 1992 Page(s): 497 —510
[12] E.B.George; M.J.T. Smith, “Speech analysis-synthesis and modification using an analysis by synthesis overlap add sinusoidal model,” Speech and Audio Processing, IEEE Transactions on , Volume: 5 Issue: 5 , Sept. 1997 Page(s): 389 —406
[13] Y. Meron ; K. Hirose, “Synthesis of vibrato singing,” Acoustics, Speech, and Signal Processing, 2000. ICASSP ''''00. Proceedings. 2000 IEEE International Conference on , Volume: 2 , 2000 Page(s): II745 -II748 vol.2
[14] 林良健, “取樣錄放與數位音頻合成,” CCL Research Journal, Vol.5, pp.8-14, Nov. 1992.
[15] 郭義境, Easy to Know MIDI , 全欣資訊圖書股份有限公司. 1995.
[16] 林志杰, MIDI玩家手冊, 第三波. 1995.
[17] 譚百華, 歌唱聲至樂器聲之即時轉換系統. 1995.
[18] 許文龍, “使用時間比例基週波形內插之國語語音合成器,” 國立台灣科技大學電機所碩士論文, 1996.
[19] 劉昭緯, “擊弦樂器音樂合成之研究”, 國立台灣科技大學電機所碩士論文 ,1998.
[20] 呂元傑, “以加法合成為基礎的音樂合成之研究,” 國立台灣科技大學電機所碩士論文 ,1999.
[21] 廖于文, “基於加法合成研究即時音樂合成與歌唱聲混聲,” 國立台灣科技大學電機所碩士論文 ,2000.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔