(3.238.7.202) 您好!臺灣時間:2021/02/26 14:29
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:林易暄
研究生(外文):LIN, YI-HSUAN
論文名稱:以卷積神經網路進行傢俱配件的圖像檢索
論文名稱(外文):Image Retrieval of Furniture Accessories Using Convolutional Neural Networks
指導教授:蔡偉和蔡偉和引用關係
指導教授(外文):TSAI, WEI-HO
口試委員:黃士嘉林義隆蔡偉和
口試委員(外文):HUANG, SHIH-CHIALIN, YIH-LONTSAI, WEI-HO
口試日期:2020-07-27
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:電子工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2020
畢業學年度:108
語文別:中文
論文頁數:55
中文關鍵詞:類神經網路遷移學習資料擴增卷積神經網絡圖像檢索
外文關鍵詞:Artificial Neural NetworkTransfer LearningData AugmentationConvolutional neural networkImage Retrieval
相關次數:
  • 被引用被引用:0
  • 點閱點閱:33
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
由於傢俱配件玲瑯滿目,其名稱複雜且非一般大眾所能夠知道,因此若民眾遇到配件損壞而想進行線上採購時,將會難以利用關鍵詞查詢的方式來找到其想要的配件。在此情況,若能透過拍照配件,然後以圖像辨識方式來判斷使用者想查詢的配件,將是友善且有效率的辦法。本論文即是探討傢俱配件的圖像檢索問題。我們嘗試由深度學習之卷積神經網絡為核心來實現傢俱配件辨識。而為了減輕系統對於大量訓練資料的需求,本論文透過遷移學習及資料擴增來將原本有限的訓練資料量進行反轉、旋轉、色階調整、改變對比度等處理。實驗結果顯示判斷正確度可達98%,另外在2%的錯誤辨識之中,我們發現是屬於連人眼都難以辨識出來的分類。
There are numerous furniture accessories, and most of their names are not well-known to the general public. As a result, when a furniture accessory is damaged, it is not easy for general people to purchase a new one online, because keyword-based search becomes infeasible in this case. Under this circumstance, it would be a friendly and efficient way to automatically recognize the accessory that the user wants by taking pictures of the accessory and then performing image recognition. Thus, this study investigates the image retrieval problem of furniture components. We try to recognize the furniture accessories with the deep learning convolutional neural network. In order to alleviate the system's need for a large amount of training data, this study uses transfer learning and data augmentation to reverse, rotate, adjust the color scale, and change the contrast of the originally limited amount of training data. The experimental results show that the retrieval accuracy can attain 98%. Among 2% of the wrong recognition, we found that the furniture belongs to those what human eyes are not able to recognize.
目 錄

摘要 i
ABSTRACT ii
誌謝 iv
目 錄 v
表目錄 vii
圖目錄 viii
第一章 導論 1
1.1研究動機 1
1.2研究背景 2
1.3章節概述 3
第二章 文獻探討 4
2.1 CIFAR-10 4
2.2 LeNet 4
2.3 MNIST 5
2.4 VGGNet 6
2.5 ResNet 10
2.6圖像檢索 14
第三章 傢俱配件圖像檢索系統之配置 16
3.1 傢俱配件圖像資料庫 16
3.2 卷積神經網路 17
3.2.1 卷積層 17
3.2.2 池化層 18
3.2.3 全連接層 18
3.3 資料擴增(Data Augmentation) 19
3.4 遷移學習(Transfer Learning) 23
3.4.1 遷移學習的背景及動機 23
3.4.2 遷移學習的概念 24
3.4.3 遷移學習的分類 25
3.5 使用MobileNet進行遷移學習 29
3.5.1 Depthwise separable convolution 29
3.5.2 網路結構與訓練 32
3.5.3 MobileNet的兩個超參數 34
第四章 實驗測試 37
4.1實驗資料庫 37
4.2實驗結果 37
4.2.1 實驗一 原始檔案與遷移學習前之預測結果 39
4.2.2 實驗一 實驗結果與分析 40
4.2.3 實驗二 資料擴增後與遷移學習前之預測結果 42
4.2.4 實驗二 實驗結果與分析 43
4.2.5 實驗三 資料擴增前與遷移學習後之預測結果 45
4.2.6 實驗三 實驗結果與分析 46
4.2.7 實驗四 資料擴增後與遷移學習後之預測結果 48
4.2.8 實驗四 實驗結果與分析 50
第五章 結論及未來展望 53
5.1 結論 53
5.2 未來展望 53
參考文獻 54





[1].Tsung-Han Chan, Kui Jia, Shenghua Gao, Jiwen Lu, Zinan Zeng, and Yi Ma” PCAnet: A simple deep learning baseline for image classification?”,IEEE Transactions on Image Processing,vol 24,no 12,pp. 5017 – 5032, 2015.
[2].Yanping Huang, Youlong Cheng, Ankur Bapna, Orhan Firat, Mia Xu Chen, Dehao Chen, HyoukJoong Lee, Jiquan Ngiam, Quoc V. Le, Yonghui Wu, Zhifeng Chen.” GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism”, arXiv:1811.06965,2018.
[3].LeCun Yann, Bottou Leon, Bengio Yoshua, & Haffner, Patrick (1998). “Gradient-based learning applied to document recognition.” Proceedings of the IEEE, 86(11), 2278-2323. DOI: 10.1109/5.726791
[4].Bartosz Paszkowski, Wojciech Bieniecki, and Szymon Grabowski, “Preprocessing for real-time handwrit- ten character recognition,” in Computer Recognition Systems 2, pp. 470–476, Springer, 2007.
[5].Dan Ciregan, Ueli Meier, and Jurgen Schmidhuber, “Multi-column deep neural networks for image classification,” in Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on, pp. 3642–3649, IEEE, 2012.
[6].Kaming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun, “Deep residual learning for image recognition,” in Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 770–778, 2016.
[7].Hyeonwoo Noh, Andre Araujo, Jack Sim, Tobias Weyand, Bohyung Han,” Large-Scale Image Retrieval with Attentive Deep Local Features”, arXiv:1612.06321.
[8].Sinno Jialin Pan , Qiang Yang,” A Survey on Transfer Learning,”in : IEEE Transactions on Knowledge and Data Engineering, pp. 1345-1359, 2009.
[9].Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam” MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications”, arXiv:1704.04861,2017.

電子全文 電子全文(網際網路公開日期:20250810)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔