跳到主要內容

臺灣博碩士論文加值系統

(34.204.180.223) 您好!臺灣時間:2021/08/01 16:16
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:陳景瀚
研究生(外文):Chen, Ching-Han
論文名稱:基於視覺感知的多媒體風格分類
論文名稱(外文):Multimedia Styles Classification Using Visual Features
指導教授:温敏淦
指導教授(外文):Wen, Ming-Gang
口試委員:温敏淦張朝旭張陽郎
口試委員(外文):Wen, Ming-GangChang, Chao-HsuChang, Scott Yang-Lang
口試日期:2012-07-20
學位類別:碩士
校院名稱:國立聯合大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2012
畢業學年度:100
語文別:中文
論文頁數:64
中文關鍵詞:西洋繪畫派別分類音樂風格分類電影類別分類
外文關鍵詞:movie genre classificationmusic style classificationpainting artistic genre classification
相關次數:
  • 被引用被引用:2
  • 點閱點閱:279
  • 評分評分:
  • 下載下載:18
  • 收藏至我的研究室書目清單書目收藏:0
本論文中提出一種全新的多媒體檢索方式,對繪畫派別、音樂風格、及電影類型等不同型式媒體,都可以利用單一圖像即可進行多媒體的分類。在視覺感知上,多媒體常以色彩與紋理作為主要的風格表現,如驚悚片電影在海報上常以黑色與紅色搭配簡單紋理,營造心理感知的視覺訴求表現。相較於多數影像分類研究中採用色彩直方圖為色彩特徵,本研究中針對色彩對視覺中風格感知的影響差異,提出了以影像代表色及代表色比重為特徵的色彩特徵設計概念,透過k-mean分群演算法取得影像代表色,並計算代表色在整張圖像上所佔的比例做為圖像色彩特徵;另外在紋理對圖像風格認知的重要性上,本研究亦以影像整體紋理趨勢反應的賈伯小波反應,取代區域紋理邊界的常見紋理特徵。在分類方法上,本研究利用支持向量機(support vector machine),搭配前述影像的色彩與紋理等低階特徵,進行多媒體風格分類實驗,以在大量多媒體資料庫的實用情境中,達到在時間效率上的可行性。
為了驗證所提方法的可行性,本研究分別建置了實驗用的三種資料庫:電影海報資料庫,為自1981年至2011年間的共有26類11,350部電影資料;音樂專輯資料庫則為1965年至2011年間,共有50種風格的8,004部音樂專輯;西洋繪畫資料,共6畫派的806張著名畫作。實驗成果相較於過去的研究,在分類正確率與時間效率上均具有顯著的效果:電影風格分類實驗中提升24.33%~35.82%正確率,音樂風格分類成效上更是大幅度提升了85.71%~111.36%;而在時間效率大約可提昇3,000%以上。由實驗證實本研究所提出的影像低階特徵,在多媒體資料上的視覺認知,具有研究上顯著的意義,同時所採用的分類方法,在程式執行時間及記憶體空間的需求上,也遠比目前已發表的方法有更佳的表現,尤其當實驗樣本資料庫愈龐大時,優勢就愈趨明顯。

In this thesis, a novel method is presented to classify different media styles by low level features of a single image. The media types include paintings, music, and movies. In our approach, two kinds of low level image features are used. One feature is extracted from the representative colors instead of feature generated by color histograms. The other feature is global textures extracted by Gabor wavelet filter. Then, a support vector machine algorithm is employed to classify the styles of an unknown movie, music, or painting.
We perform three experiments in the study: the movie genre classification, the music style classification, and painting artistic genre classification. The first experiment is conducted on a movie database which contains 11,350 movie records created from 1981 to 2011. The average classification rate on 9 genres is 34%. The second experiment is conducted on a musical record database which contains 8,004 music CDs produced from 1965 to 2011. The accuracy rate of music genre classification is significant upgrading about 85% to 111%. In the final experiment, famous Western paintings artistic genre classification results were shown. All three experimental results demonstrate the validity and efficiency of our proposed method. The main contributions of the thesis are using a single image low level feature to effectively classify different type media genres and enhancing the performance of the classification.

圖目錄 IX
表目錄 X
第一章 緒論 1
1.1 研究背景與動機 1
1.2 多媒體風格 2
1.2.1 繪畫風格分類 3
1.2.2 音樂風格分類 4
1.2.3 電影風格分類 6
1.3 研究限制 7
1.4 研究範圍與架構 7
1.5 研究流程 8
第二章 文獻探討 10
2.1 自動化畫風分類相關研究 10
2.2 自動化音樂分類相關研究 11
2.3 自動化電影分類相關研究 11
第三章 視覺感知分類特徵 13
3.1 常見的色彩空間 13
3.2 常見色彩特徵 16
3.3 紋理特徵 18
第四章 常見圖像分類方法 20
4.1 K-MEAN 20
4.2 聯合平等貢獻(JOINT EQUAL CONTRIBUTION,JEC) 21
4.3 支持向量機(SUPPORT VECTOR MACHINES, SVM) 22
4.3.1 二類別線性支持向量機 23
4.3.2 非線性支持向量機 24
第五章 研究方法 26
5.1 圖像前處理 26
5.2 特徵設計 27
5.2.1 色彩特徵設計 28
5.2.2 紋理特徵設計 30
5.3 實驗環境 31
第六章 實驗結果 32
6.1 實驗資料庫 32
6.1.1 繪畫圖像資料 32
6.1.2 音樂圖像資料 33
6.1.3 電影圖像資料 35
6.2 實驗正確率 37
6.3 代表色數量分類訓練 38
6.3.1 繪畫風格分類最佳代表色數量訓練 39
6.3.2 音樂風格分類最佳代表色數量訓練 41
6.3.3 電影風格分類最佳代表色數量訓練 43
6.4 代表色比例閥值訓練 44
6.4.1 繪畫風格最佳閥值訓練 45
6.4.2 音樂風格最佳閥值訓練 47
6.4.3 電影風格最佳閥值訓練 49
6.5 多媒體風格分類實驗 51
6.5.1 繪畫風格分類實驗 51
6.5.2 音樂風格分類實驗 52
6.5.3 電影風格分類實驗 54
第七章 結論與討論 56
第八章 未來研究建議 58
參考文獻 60


[1] Aida Austin, Elliot Moore II, Udit Gupta and Parag Chordia, 2010. “Characterization of Movie Genre Based On Music Score”, Acoustics Speech and Signal Processing (ICASSP), 2010 IEEE International Conference.
[2] Ameesh Makadia, Vladimir Pavlovic, and Sanjiv Kumar, 2008. “A New Baseline for Image Annotation”, ECCV 2008 Proceedings of the 10th European Conference on Computer Vision: Part III.
[3] Andrea Gronemeye, 1998. Film (Crash Course Series), Barrons Educational Series Inc.
[4] Bilge Günsel, Sanem Sariel and Oguz Icoglu, 2005. “Content-Based Access to Art Paintings”, Image Processing of the IEEE International Conference, ICIP 2005.
[5] Christopher Burges, 1998. “A Tutorial on Support Vector Machines for Pattern Recognition”, Data Mining Knowl. Discov, 2:121-167.
[6] Confidential Concepts, 2005. Naïve Art, Grange Books.
[7] Courthion and Pierre, 1989. SEURAT, Thames and Hudson.
[8] David Bainbridge and Tim Bell, 2006. “Identifying music documents in a collection of images”, ISMIR, pp. 47–52.
[9] David Bainbridge and Tim Bell, 2001. The challenge of optical music recognition, Computers and the Humanities, IEEE Computer, pp.38-47.
[10] Dennis Gabor, 1946. “Theory of Communication”, J. Institution of Electrical Engineers, vol.93, pp. 429-457.
[11] J. B. MacQueen, 1967. “Some Methods for classification and Analysis of Multivariate Observations”, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, Vol. 1, pp281-297.
[12] Jana Zujovic, Lisa Gandy, Scott Friedman, Bryan Pardo and Thrasyvoulos Pappas, 2009, “Classifying Paintings by Artistic Genre: An Analysis of Features & Classifiers”, Multimedia Signal Processing of the IEEE International Workshop, MMSP '09.
[13] Jānis Lībeks and Douglas Turnbull, 2011. “You Can Judge an Artist by an Album Cover:Using Images for Music Annotation”, IEEE MultiMedia.
[14] John Daugman, 1985. “Uncertainty Relation for Resolution In Space, Spatial-Frequency, and Orientation Optimized by Two-Dimensional Visual Cortical Filter”, J. Optical Society of America A-Optics Image Science and Vision, vol. 2, pp. 1160-1169.
[15] Last.fm, 2011. http://www.last.fm/.
[16] LIBSVM, 2012, http://www.csie.ntu.edu.tw/~cjlin/libsvm/, Chih Chung Chang and Chih Jen Lin.
[17] Lior Shamir, Tomasz Macura, Nikita Orlov,D. Mark Eckley and Ilya Goldberg, 2010. “Impressionism, Expressionism, Surrealism: Automated Recognition of Painters and Schools of Art”, ACM Transactions on Applied Perception (TAP) Volume 7 Issue 2.
[18] Mateja Culjak, Bruno Mikuš, Karlo Jež and Stjepan Hadji, 2011. “Classification of art paintings by genre”, MIPRO 2011.
[19] Michael Casey, Remco Veltkamp, Masataka Goto, Marc Leman, Christophe Rhodes, and Malcolm Slaney, 2008. “Content-based music information retrieval: Current directions and future challenges”, Proceedings of the IEEE, 96(4):668–696.
[20] Movie Web, 2011. http://www.movieweb.com/.
[21] Sanjay Jain and Rakesh Singh Jadon, 2009. “Movies Genres Classifier using Neural Network”, The 24th International Symposium on Computer and Information Sciences(ISCIS) , IEEE.
[22] Seong-Whan Lee and Alessandro Verri, 2002. “Pattern recognition with support vector machines : first international workshop”, SVM 2002, Niagara Falls, Canada, August 10, 2002 : proceedings , New York.
[23] Semir Zeki, 1999. “Inner vision: An exploration of art and the brain”, Oxford University Press.
[24] 林雅惠,1997,Fauvisme 野獸派,縱橫文化,台北。
[25] 吳芳怡,2007,不同類型電影的用色特徵, 國立交通大學應用藝術研究所碩士論文。
[26] 佟景韩、余丁、鹿鐳,2010,欧洲19世紀美术,中国人民大學出版社,北京。
[27] 教育部重編國語辭典修訂本,2012,http://dict.revised.moe.edu.tw/,中華民國教育部。
[28] 劉振源,1996,立體派繪畫,藝術圖書公司,台北。
[29] 羅伯修斯、林惺嶽,2009,梵谷名畫500選,藝術家,台北。

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top