跳到主要內容

臺灣博碩士論文加值系統

(3.235.185.78) 您好!臺灣時間:2021/07/27 16:09
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:黃亮綱
研究生(外文):Huang, Liangkang
論文名稱:以尺度不變特徵結合色彩特徵的視覺字影像描述及分類
論文名稱(外文):Visual Words With Scale-Invariant Features And Color Features For Image Description And Classification
指導教授:楊乃中郭忠民郭忠民引用關係
指導教授(外文):Yang, NaichungKuo, Chungming
口試委員:楊乃中郭忠民謝朝和蔡吉昌
口試委員(外文):Yang, NaichungKuo, ChungmingHsieh, ChaurhehTsai, Chitsang
口試日期:2012-07-05
學位類別:碩士
校院名稱:義守大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2012
畢業學年度:100
語文別:中文
論文頁數:71
中文關鍵詞:尺度不變特徵轉換視覺字視覺描述子
外文關鍵詞:SIFTVisual WordVisual Descriptors
相關次數:
  • 被引用被引用:0
  • 點閱點閱:1322
  • 評分評分:
  • 下載下載:15
  • 收藏至我的研究室書目清單書目收藏:0
由於影像資料庫的日益增加,如何有效的管理就顯的更加重要。一般的影像檢索系統是藉由類似特徵查詢到相似影像,而分類系統是影像對每個類別的特徵性質進行比對並分類到適合的類別裡。
利用尺度不變特徵轉換(Scale-Invariant Feature Transform, SIFT)擷取特徵點並改良傳統SIFT無色彩特徵資訊後,訓練特徵點產生視覺字(Visual Word)去作為視覺描述子(Visual Descriptors)和比對精確效能的指標,由於SIFT對平滑背景部分無法有效擷取特徵,我們利用區塊特徵(KeyBlock)改善平滑背景部分無擷取特徵點而影響影像的比對。影像中的視覺字描述是否有助於視覺性的表達,我們利用影像檢索來檢驗視覺字是否有效描述影像並比對相似影像,如果視覺字能有效的比對出相似影像,我們可以將視覺字應用於影像的分類上。
As the growing image database, to manage the database effectively is more and more important. CBIR (content-based image retrieval) is the well known systems with content-based image retrieval, and it has been widely adopted in Multimedia database. Image classification system which uses visual word to classify the suitable classification in undefined content-based image is difference in image retrieval. We extract SIFT(Scale-Invariant Feature Transform) image feature and training visual word which is image descriptor for comparative standard. With the rapid growing of image databases, how to manage the database effectively becomes an important issue. The content-based image retrieval (CBIR) is a well known technique for content-based image retrieval, and has been widely adopted form multimedia-database applications. Typically, image classification systems compare visual words in dictionary, and then create suitable classifications
In the thesis, we first use Scale-Invariant Feature Transform (SIFT) to extract image features. Then we train the visual words by merging similar features. The trained visual words are collected to our visual dictionary. Experimental results show that our word dictionary is able to describe images effectively.
摘要I
ABSTRACT II
致謝III
目錄I
圖目錄II
表目錄IV
第一章 緒論1
1.1 問題描述1
1.2 研究動機3
1.3 論文架構3
第二章 相關研究回顧4
2.1 主要色彩描述子4
2.2 視覺字5
2.2.1 以特徵點為基礎視覺字5
2.1.1 偵測尺度空間極值5
2.1.2 特徵點定位與篩選8
2.1.3 特徵點方位指定9
2.1.4 特徵點描述向量建立10
2.2.2 以特徵區塊為基礎視覺字12
第三章 以視覺字典的影像描述子13
3.1 視覺字典建立13
3.1.1 訓練影像挑選14
3.1.2 特徵點計算14
3.1.3 計算特徵分布15
3.1.4 特徵點訓練18
3.1.5 視覺字存入字典19
3.1.6 視覺字典大小21
3.2 建立影像特徵描述22
3.2.1 微觀視覺字描述23
3.2.2 巨觀視覺字描述24
3.3 檢索與分類系統27
3.3.1 特徵比對28
3.3.2 分類系統29
第四章 實驗數據及結果31
4.1 影像數據庫31
4.2 實驗結果32
4.3 影像分類系統56
第五章 結論與未來研究59
5.1 結論59
5.2 未來研究59
參考文獻60
圖目錄
圖 1 要尋找的影像1
圖 2 傳統檢索系統2
圖 3 分類系統2
圖 4 具代表性的影像特徵2
圖 5 視覺字描述3
圖 6 RGB色彩空間結構4
圖 7 SIFT示意圖5
圖 8 高斯模糊影像圖6
圖 9 高斯差值影像示意圖7
圖 10 高斯差分示意圖7
圖 11 極值偵測示意圖8
圖 12 旋轉影像與主方位相同示意圖10
圖 13 區塊示意圖10
圖 14 特徵點描述向量示意圖11
圖 15 SIFT特徵點影像11
圖 16 視覺字統計示意圖11
圖 17 運用文字可拆解性套用至影像12
圖 18 整體架構示意圖12
圖 19 整體流程架構圖13
圖 20 訓練影像集14
圖 21 特徵點擷取示意圖15
圖 22 特徵區塊大小示意圖16
圖 23 向量方向直方圖示意圖17
圖 24 為視覺字典建立的整體流程圖。20
圖 25 視覺字典篩選流程圖流程圖22
圖 26 微觀特徵描述示意圖23
圖 27 微觀特徵描述示意圖24
圖 28 特徵密集排除示意圖24
圖 29 特徵區塊擷取示意圖25
圖 30 微觀特徵描述示意圖25
圖 31 特徵分布分散密集排除示意圖26
圖 32 影像分割示意圖26
圖 33 巨觀查詢流程圖27
圖 34 巨觀視覺字拼圖27
圖 35 檢索系統流程圖28
圖 36 類別模組流程圖29
圖 37 類別模組流程圖30
圖 38 影像資料庫32
圖 39 ARR比較(SIFT有無加入色彩)35
圖 40 ANMRR比較(SIFT有無加入色彩)36
圖 41 ARR比較(色彩平均及色彩直方圖)38
圖 42 ANMRR比較(色彩平均及色彩直方圖)39
圖 43 ARR比較(色彩直方圖及RGB色彩直方圖+背景擷取)41
圖 44 ANMRR比較(色彩直方圖及RGB色彩直方圖+背景擷取)42
圖 45 ARR比較(色彩直方圖+背景擷取及巨觀查詢)44
圖 46 ANMRR比較(色彩直方圖+背景及巨觀查詢)45
圖 47 ARR比較(色彩直方圖+巨觀查詢及MPEG-7 DCD)47
圖 48 ANMRR比較(色彩直方圖+巨觀查詢及MPEG-7 DCD)48
圖 49 ARR比較(RGB色彩直方圖+巨觀查詢及LBA)49
圖 50 ANMRR比較(RGB色彩直方圖+巨觀查詢及LBA)50
圖 51 ARR比較(巨微觀不同權重比例)52
圖 52 ANMRR比較(巨微觀不同權重比例)53
圖 53 ARR比較(巨微觀不同權重比例)54
圖 54 ANMRR比較(巨微觀不同權重比例)55
圖 55 (a)巨觀:微觀=0.7:0.3 (b)巨觀:微觀=0.3:0.7 56
圖 56 (a)巨觀:微觀=0.7:0.3 (b)巨觀:微觀=0.3:0.7 56
圖 57 分類樹枝狀圖57
表目錄
表 1 影像資料庫31
表 2 ARR和ANMRR的數值(a)SIFT方向向量35
表 3 ARR和ANMRR的數值(a) RGB色彩平均38
表 4 ARR和ANMRR的數值(a) RGB色彩直方圖41
表 5 ARR和ANMRR的數值(a) RGB色彩直方圖+背景擷取44
表 6 ARR和ANMRR的數值(a) RGB色彩直方圖+巨觀查詢47
表 7 ARR和ANMRR的數值(a) RGB色彩直方圖+巨觀查詢49
表 8 方法ARR與ANMRR比較51
表 9 ARR和ANMRR的數值(a)巨觀:微觀=1:0 52
表 10 ARR和ANMRR的數值(a)巨觀:微觀=0.7:0.3 54
表 11 分類影像數據庫57
表 12 巨觀分類結果57
表 13 微觀分類結果58
[1]A. Bosch, A. Zisserman, and X. Munoz, “Image Classification Using Random Forests and Ferns,” Proc. Int’l Conf. Computer Vision, 2007.
[2]A. Vailaya, A. Figueiredo, A. Jain, and H. Zhang, “Image classification for content-based indexing,” IEEE Transactions on Image Processing 10 (2001) 117–129.
[3]B. S. Manjunath, J.R. Ohm, V. V. Vasudevan, and A. Yamada, “Color and Texture Descriptors,” Circuits and Systems for Video Technology, IEEE Transactions, vol. 11, Issue: 6, pp. 703 – 715, June 2001.
[4]C. Dance, J. Willamowski, L. Fan, C. Bray, and G. Csurka, “Visual categorization with bags of keypoints,” In ECCV, Prague, Czech Republic, 2004.
[5]D. G. Lowe, “Distinctive Image Features from Scale-invariant Keypoints,” International Journal of Computer Vision, 2004, Vol. 60, No. 2, pp. 91–110.
[6]ISO/IEC JTC1/SC29/WG11/N3914,” MPEG-7 Visual part of experimentation Model Version 9.0,” January 2001.
[7]J. C. V. Gemert, C. J. Veenman, and A. W. M. Smeulders, “Visual word ambiguity,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009.
[8]J. Yang, Y. G. Jiang, A. G. Hauptmann, and C. W. Ngo, “Evaluating bag-of-visual-words representations in scene classification,” ACM SIGMM Workshop on Multimedia Information Retrieval (MIR), in conjunction with ACM Multimedia, Germany, 2007.
[9]L. Ledwich and S. Williams, “Reduced SIFT features for image retrieval and indoor localization,” In Proc. Australasian Conf. on Robotics and Automation (ACRA), 2004.
[10]L. Qin, Q. Zheng, S. Jiang, Q. Huang, and W. Gao, “Unsupervised texture classification: Automatically discover and classify texture patterns,” Image and Vision Computing 26 (2008) 647–656.
[11]L. Zhu, A. Rao, and A. Zhang, “Theory of Keyblock-Based Image Retrieval,” ACM Transactions on Information Systems 20(2), 224–257 (2002)
[12]L. Zhu, A. Zhang, A. Rao and R. Srihari, “Keyblock: An approach for content-based image retrieval,” In Proceedings of ACM Multimedia 2000, pages 157–166, Los Angeles, California, USA, Oct 30 - Nov 3 2000.
[13]N. C. Yang, W. H. Chang, C. M. Kuo, and T. H Li, “A fast MPEG-7 dominant color extraction with new similarity measure for image retrieval,” J. of Visual Commun. and Image Representation, vol. 19, pp. 92-105, Feb. 2008.
[14]N. Motohashi, T. Takagi, and K. Yamauchi, “Improvement of Bag of Visual Words using Iconclass,” Fuzzy Information Processing Society (NAFIPS), 2010.
[15]S. Arivazhagan and L. Ganesan, “Texture segmentation using wavelet transform,“ Pattern Recognition Letters 24 (2003) 3197–3203
[16]W. J. Xie, D. Xu, Y. J. Tang, and S. Y. Liu, “Constructing Class-Specific Codebooks based on Mutual Information Method for Natural Scene Categorization,” JOURNAL OF INFORMATION SCIENCE AND ENGINEERING XX, 1-xxx (xxxx).
[17]Y. D. Zhao, L. P. Zhang, P. X. Li, and B. Huang, “Classification of high spatial resolution imagery using improved Gaussian Markov randomfield - based texture features,” IEEE Trans. Geosci. Remote Sens., vol. 45, no. 5, pp. 1458–1468, May 2007.
[18]Y. G. Jiang, C.W. Ngo, and J. Yang, “Towards optimal bag-of-features for object categorization and semantic video retrieval,” ACM International Conference on Image and Video Retrieval (CIVR), Amsterdam, The Netherlands, Jul. 2007.
[19]Y. M. Chen, “Block-based Visual Words for Image Retrieval and Classification,” 2012
[20]Z. Lei, R. Al Bing, and Z. Aldong, “Codebook design of keyblock based image retrieval,” ACM Trans. Inf. Syst., vol. 20, pp. 224‐257, 2007.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top