(3.238.96.184) 您好!臺灣時間:2021/05/08 04:31
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:蔡易行
論文名稱:使用特徵歌曲對MP3音樂物件進行自動化內涵式分類
論文名稱(外文):Automatic Content-Based Classification of MP3 Music Objects Using Eigensong
指導教授:劉志俊劉志俊引用關係
學位類別:碩士
校院名稱:中華大學
系所名稱:資訊工程學系碩士班
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:89
語文別:中文
論文頁數:35
中文關鍵詞:特徵歌曲MP3歌曲內涵分類音訊分類
外文關鍵詞:EigensongMP3 content-based classificationAudio Classification
相關次數:
  • 被引用被引用:1
  • 點閱點閱:102
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
隨著電腦科技多媒體系統的應用及網際網路的快速發展,提昇我們的生活品質以及愈來愈重視平常的休閑活動,因此多媒體系統的聲光娛樂大為風行,從早期體積龐大的錄影帶(tape:VHS、Beta),演變至數位化(digital)且體積小的VCD,乃至於畫面清晰的DVD,在在都說明現在使用者對影片解析度的要求,而其關鍵點在於MPEG標準的制定。我們可以發現到目前許多的多媒體壓縮都是以MPEG為主流,例如:在音訊方面(audio)有現在耳熟能詳的MP3音樂及影音光碟VCD,它們都是使用了MPEG 1的標準。而使用MPEG 2標準所訂定的DVD也正在慢慢的興起當中。對MPEG 4臉部辨識(facial animation)的應用也愈來愈受到大家的重視了。在影像方面(image)則有訂定MPEG 7的標準,由此可知在新一代的多媒體系統中MPEG標準是十分受到大家注意的,所以對使用MPEG標準制定的多媒體檔案,建立一套多媒體內涵式查詢檢索(Multimedia Content-base Retrieval and extract)就是一項極為重要且具有價值的研究議題。
過去對多媒體內涵式查詢檢索中的研究中,大多都是以影像及視訊為主要研究範圍,而音訊與音樂則是最近幾年才開始有學者深入研究,對音訊內涵式查詢這方面大家都將焦點放在MID或是WAVE上,比較少人專注在MP3的音樂壓縮格式上。而在近些年來由於網路的盛行,對多媒體音樂物件的需求變大了,而MP3的高壓縮比及近似CD音質的特性,是最能符合網際網路上發展多媒體音樂的音樂物件了,同時MP3音樂也大大增加多媒體的應用。
MP3已經成為網際網上最重要的多媒體音樂檔案格式,而目前對MP3音樂物件自動化分類的研究非常少。在本篇論文中我們對MP3音樂物件進行自動化的內涵式分類,我們提出一種利用特徵歌曲(eigensong)來進行MP3音樂物件自動化分類的演算法,將MP3國語流行音樂物件分類為三類:古典音欒、男歌手流行歌曲及女歌手流行歌曲。我們並將此演算法應用在我們的MP3國語流行音樂資料庫中,其分類正確率介於72﹪∼91﹪。
As the growth of the Internet , multimedia applications on the World Wide Web are becoming popular. MPEG standards have provided compression techniques for a wide range of multimedia applications. In this paper we propose an approach for automatic content-based classification of MP3 music objects. We use 256-dimension features to represent the content of an MP3 music object. The axes feature space are called eigensongs. Our approach treats MP3 classification as a two-dimensional classification problem. Unknown MP3 objects are projected into the 256-dimensional feature space. Then, its corresponding features are represented using the linear combination of the eigensongs. Using this technique we can classify MP3 music objects into three music classes, i.e. , classical, female, and male. As the experiments shown, our MP3 classification system can classify unknown MP3 objects with an accuracy rate higher than 72﹪.
1.簡介
2.MPEG 1音訊編碼
2.1MP3音訊編碼原理
3. MP3分類系統簡介
3.1 MP3歌曲切割模組
3.2 MP3歌曲特徵值擷取模組
3.3 特徵歌曲計算模組
3.4 特徵歌曲分類模組
4. 實驗結果
4.1 實驗環境設定
4.2 實驗步驟及結果
4.3 實驗分析
4.4 實驗分類結果分析
5. 結論及未來工作
6. 參考文獻
附錄A:Yahoo MP3音樂分類子目錄
附錄B:MP3音樂分類系統操作說明
[1] A.T. Matthew,and P.A. Pentland, ” Face Recognition Using Eigenface”, Computer Vision and Pattern Recognition, 1991.Proceedings CVPR’91., IEEE Computer Society Conference on, 1991.
[2] C. Colombo, A. Del Bimbo, and P. Pala,” Semantics in Visual Information Retrieval”, IEEE Multimedia, Vol.6, No.3, July-September,1999.
[3] C.-C. Liu, J.-L. Hsu, and A.L.P. Chen,” An Approximate String Matching Algorithm for Content-Based Music Data Retrieval”, IEEE Multimedia Computing and Systems, Vol.1, July 7-11, 1999.
[4] G. Lu, and T. Hankinsion, ” A technique towards automatic audio classification and retrieval”, IEEE International Conference on Signal Processing. 1998.
[5] G. Robbert van der Waal, K. Brandenbury and G. Stoll, ”Current and future standardization of high-quality digit audio coding in MPEG”, Appilcations of Signal Processing to Audio and Acoustics, 1993, Final program and paper Summaries. 1993 IEEE Workshop on, 1993.
[6] J. Foote,” A Similarity Measure for Automatic Audio classification”, Proc.AAAI 1997 Spring Symposium on Intelligent Integration and Use of Text, Image, Video, and Audio Corpora. Stanford,March 1997.
[7] K. Hirata, S. Mukherjea, W.-S. Li, and Y. Hara,”Integrating Image Matching and Classification for Multimedia Retrieval on the Web“, IEEE International Conference on Multimedia Computing and Systems, June 7-11, 1999.
[8] L. Yapp and G. Zick, ” Speech Recognition on MPEG/Audio Encoded Files “, IEEE International Conference on Multimedia Computing and Systems, 1997.
[9] M. Flickner et al, ”Query by Image and Video Content: The QBIC System”, IEEE Computer,28(9),sep,1995.
[10] M. Setnes and R. Babuska, ” Fuzzy Relational Classifier Trainedby Fuzzy Clustering”, IEEE TRANSACTIONS ON SYSTEMS,MAN,AND CYBERNETICS-PART B: CYBERNETICS, VOL. 29, NO. 5, OCTOBER 1999.
[11] P. Noll,” MPEG Digit Audio Coding”, IEEE Signal Processing Magazine Volume : 145, Sept. 1997.
[12] P. Noll, ”High Quality Audio For Multimedia:Key Technologies and MPEG Standards”, Global Telecommunications Conference, 1999. GLOBECOM’99, Volume:4, Dec. 1999.
[13] T.J. Robinson,” The K-D-B-Tree: A Search Structure for Large Multidimensional Dynamic Indexes“, Proc. ACM SIGMOD Conf , 1981.
[14] T. Zhang and C.-C. Jay Kuo, ” Hierarchical Classification of Audio Data for Archiving and Retrieving”, Acoustics, Speech, and Signal Processing, 1999. Proceedings., 1999 IEEE International Conference on Volume:6, 1999.
[15] Y. Nakajima et al, ”A fast audio classification from MPEG coded data”, Acoustics, Speech, and Signal Processing, 1999 Proceeding., 1999 IEEE International Conference.
[16]蔡伯俊, 劉志俊, ”網際網路上MP3內涵式搜尋引擎”, Proceedings of 2000 Workshop on Internet & Distributed Systems, Vol 1, pp 18-27.
[17] ISO/IEC 11172-3:1993, “Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5Mbit/s — Part 3:Audio.”
[18]參考 ”http://music.yahoo.com/”
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔