跳到主要內容

臺灣博碩士論文加值系統

(3.235.120.150) 您好!臺灣時間:2021/07/31 14:08
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蒲羿翰
研究生(外文):Yi-Han Pu
論文名稱:利用立體聲資訊做歌曲檢索系統
論文名稱(外文):Music Retrieval System Using Stereo information
指導教授:尤信程
口試委員:蔡偉和鄭士康杭學鳴
口試日期:2012-01-13
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:資訊工程系研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2012
畢業學年度:100
語文別:中文
論文頁數:80
中文關鍵詞:最長共同子序列動態時間校正MPEG-7 Audio時間差
外文關鍵詞:RLCSDTWMPEG-7 AudioICTD
相關次數:
  • 被引用被引用:2
  • 點閱點閱:182
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文的主題是希望透過立體聲音訊之間的關係做為特徵值,建構一個歌曲檢索系統。我們擷取出一些左聲道、右聲道中的峰值(Peak)訊號資訊,以此訊號資訊加以計算成ICTD並做為特徵值,並且利用RLCS以及DTW做為搜尋比對的基礎,來建構出歌曲的檢索系統,最後我們將ICTD特徵值和MPEG-7音訊特徵值(Audio Descriptor)做多重階層的搜尋,來探討這整個歌曲的檢索系統所達成的效果。

In this thesis, we want to use stereo information as characteristic to establish a musical retrieval system. We extract the peak information in left channel and right channel, using this peak information to calculate ICTD as characteristic, and then compare these characteristic by RLCS and DTW algorithm to establish musical retrieval system. Finally, stereo information will do multi level search with MPEG-7 Audio Descriptor to explore the entire music retrieval system.

摘 要 i
ABSTRACT ii
致 謝 iii
目 錄 iv
表目錄 vi
圖目錄 vii
第一章 緒論 1
1.1 研究動機 1
1.2 研究目的 1
1.3 研究貢獻 2
1.4 章節編排 3
第二章 空間聽覺 4
2.1 Duplex Theory 4
2.2 前置效應 5
第三章 MEPG-7音訊特徵值 6
3.1 MPEG-7標準 6
3.2 MPEG-7聲音簽章特徵值 8
3.3 MPEG-7歌曲檢索系統 12
第四章 立體聲音訊特徵之擷取 14
4.1 子頻帶擷取 14
4.2 包絡檢知器 15
4.3 以訊框為基礎之立體聲音訊特徵擷取 17
4.4 以峰值為基礎之特徵訊號 19
4.4.1 峰值偵測 19
4.4.2 特徵值計算 22
第五章 搜尋演算法 25
5.1 動態規畫(Dynamic Programming) 25
5.1.1 重疊子問題(over lapping subproblem) 25
5.1.2 動態規畫演算法 26
5.2 Longest Common Subsequence(LCS) 27
5.3 Rough Longest Common Subsequence(RLCS) 29
5.4 Dynamic Time Warping (DTW) 33
5.5 Edit Distance(ED) 36
5.6 實驗討論 37
5.6.1 RLCS實驗討論 38
5.6.2 DTW實驗討論 43
5.6.3 Edit Distance實驗討論 50
5.6.4 立體聲特徵與MPEG-7特徵檢索系統比較 51
5.6.5 數位雜訊音樂實驗討論 54
5.6.6 48kbps實驗討論 56
第六章 ICTD特徵值與聲音簽章特徵值做多重階層搜尋 57
6.1 first-ASF, second-ICTD 57
6.2 first-ICTD, second-ASF 63
6.3 combined ASF and ICTD 64
第七章 歌曲資料庫辨識策略之探討 67
7.1 歌曲辨識策略 67
7.2 實驗討論 69
第八章 以峰值數目分類搭配歌曲檢索系統 72
8.1 失真探討 72
8.2 應用 73
第九章 結論與未來展望 76
9.1 結論 76
9.2 未來展望 76
參考文獻 78



[1]D Wang, G Brown, "Computational Auditory Scene Analysis", John Wiley & Sons, Inc., 2005, ch. 5
[2]RY Litovsky, HS Colburn, WA Yost, SJ Guzman, "The precedence effect", The Journal of the Acoustical Society of America, vol. 106, Issue 4, pp. 1633-1654, 1999
[3]ISO/IEC, "Multimedia content description interface – part 4: Audio", ISO/IEC, International Standard 15938-4, 2002.
[4]李瑞育,利用MPEG-7之音樂特徵值做歌曲之辨識,國立臺北科技大學碩士論文,民國93年。
[5]陳威華,利用MPEG-7之音樂特徵值做歌曲檢索系統,國立臺北科技大學碩士論文,民國96年。
[6]洪名人,利用獨立成分分析及因素分析對MPEG-7音訊特徵描述元資料降維進行歌曲辨識與檢索之研究,國立臺北科技大學碩士論文,民國99年。
[7]L Gang, AN Akansu , M Ramkumar, "On-line music protection and MP3 compression", Proc. IEEE Int., vol. 7, pp. 13-16, 2001
[8]JC Whitaker, KB Benson, "Standard Handbook of Audio and Radio Engineering", Mcgraw-Hill, 2001
[9]J Lesurf, "The Envelope detector"
http://www.st-andrews.ac.uk/~www_pa/Scots_Guide/RadCom/part9/page2.html
[10]鄭凡寓,音訊編碼空間定位評估系統,國立臺北科技大學碩士論文,民國97年。
[11]R Clifford, M Christodoulakis, T Crawford, D Meredith, and G Wiggins, "A fast,randomised, maximal subset matching algorithm for document-level music retrieval", in Proceedings of International Conference on Music Information Retrieval, pp.150-155, 2006
[12]P.-Y Hsiao , J.K.-H Li, C.-C Tsai , "A sweeping line algorithm based on two dimensional region search",IEEE Region 10 Conference on Computer and Communication Systems, September 1990, vol. 2, pp. 496-500,1990
[13]G Aloupis, T Fevens, S Langerman, T Matsui, A Mesa, Y Nunez, D Rappaport,and G Toussaint, "Algorithms for computing geometric measures of melodic similarity", Computer Music Journal, vol. 30, pp. 67-76, 2006
[14]HJ LIN, HH WU, CW WANG, "Music Matching Based on Rough Longest Common Subsequence", Journal of Information Science and Engineering, pp. 95-110, 2011
[15]Jyh-Shing Roger Jang, "Audio Signal Processing and Recognition," available at the links for on-line courses at the author''s homepage at http://www.cs.nthu.edu.tw/~jang.
[16]M Müller, "Information retrieval for music and motion", 2007, ch. 4.
[17]L Xu, Max Q.-H Meng, R Liu, K Wang, "Robust peak detection of pulse waveform using height ratio", 30th Annual International Conference of the IEEE, pp. 3856-3859, 2008
[18]ETSI TS 126 404 http://www.3gpp.org/FTP/Specs/html-info/26404.htm
[19]ETSI TS 126 405 http://www.3gpp.org/FTP/Specs/html-info/26405.htm
http://www.st-andrews.ac.uk/~www_pa/Scots_Guide/RadCom/part9/page2.html
[20]Parametric Stereo, http://www.codingtechnologies.com/products/paraSter.htm, Coding Technologies
[21]VA Best, "Spatial Hearing with Simultaneous Sound Sources: A Psychophysical Investigation", 2004, ch. 1.
[22]C Faller, "Parametric Coding of Spatial Audio", Proc. of the 7th Int. Conference on Digital Audio Effects (DAFx’04), 2004
[23]tooLAME: MPEG Audio Layer II VBR encoder, http://toolame.sourceforge.net/
[24]MPEG-7 Overview (Version 10), ISO/IEC JTC1/SC29/WG11 N6828, Palma de Mallorca, Oct. 2004.
[25]ISO/IEC, "Multimedia content description interface – part 6: Reference Software", ISO/IEC, International Standard 15938-6, 2003.
[26]L Smith, "A tutorial on Principal Component Analysis", 2002.
http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top