跳到主要內容

臺灣博碩士論文加值系統

(44.192.38.248) 您好!臺灣時間:2022/11/27 06:14
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:楊昕翰
研究生(外文):YANG, HSIN-HAN
論文名稱:以景深為基礎的人像辨識之深度學習研究
論文名稱(外文):Deep Learning Research on Human Detection Using Depth Maps
指導教授:黃鎮淇
指導教授(外文):HUANG, JEN-CHI
口試委員:黃鎮淇許西州陳毓璋
口試委員(外文):HUANG, JEN-CHIHSU, HSI-CHOUCHEN, YU-CHANG
口試日期:2020-06-01
學位類別:碩士
校院名稱:國立屏東大學
系所名稱:資訊工程學系碩士班
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2020
畢業學年度:108
語文別:中文
論文頁數:76
中文關鍵詞:深度學習景深圖人像辨識類神經網路
外文關鍵詞:Deep learningDepth mapHuman identifyNeural network
相關次數:
  • 被引用被引用:1
  • 點閱點閱:212
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
  本研究是以深度學習方法針對人像的辨識為基礎,使用的神經網路的模型為 Mask RCNN,使用監督式學習,先對所有人像影像先進行標記,讓神經網路只學習標記出來的部分,使用彩色人像混合景深
人像做訓練,訓練次數皆為 1000 次,使用全彩色人像圖、全景深人像圖、彩色人像圖與景深人像圖各半,各別使用 10 張、30 張、60 張圖像做訓練,所訓練的人像影像皆為相同姿勢與地點,以確保公平性,實驗結果發現混合彩色圖與景深圖的模型得分皆為最高,10 張、30張、60 張分別為 0.999、0.999、0.997。我們觀察對同一張圖像分別使用 10 張、30 張、60 張訓練模型進行辨識時,混合式的變化為-0.029,全彩色圖的變化為 0.024,全景深圖的變化則為 0.055 最高,代表在
使用全景深圖做訓練的情況下,景深圖數量的增加對於變化有明顯的正成長,且在大量的訓練資料下,使用景深圖對節省儲存空間也有相當大的幫助。
  This study is based on the deep learning methods for the recognition of portraits. The neural network model is COCO's Mask RCNN. Using supervised learning, all portrait images are first marked, so that the neural network only learns the marked parts. Using color portrait mixed depth map portrait training, the number of training is 1000 times, using full color portrait, panoramic deep portrait, color portrait and depth map portrait, each using 10, 30, 60 image pictures in the training, the trained portrait images are all in the same position and location to ensure fairness. The experimental results show that the model scores of the mixed color map and the depth map are the highest, 10, 30, 60 image pictures are 0.999,0.999,0.997. When we observe the same image using 10, 30, 60 image pictures training models for identification, the color map and depth map change is -0.029, the full color map changes to 0.024, and the panoramic depth map changes to 0.055. The highest, in the case of training using panoramic deep maps, the increase in the number of depth maps has a significant positive growth for the changes, and with a large amount of training materials, the use of depth maps can also be a quite helpful way to save storage space.
誌謝 i
摘要 ii
Abstract iii
目錄 iv
表目錄 vii
圖目錄 viii

第一章 緒論 1
 1.1 前言 1
 1.2 研究目的 1
第二章 系統架構及硬體介紹 2
 2.1 系統架構 2
 2.2 硬體介紹 2
  2.2.1 Kinect 2
  2.2.2 MSI GS73VR 7RF 3
 2.3 軟體介紹 4
  2.3.1 Tensorflow 4
  2.3.2 Anaconda 4
  2.3.3 CUDA 4
  2.3.4 cuDNN 4
第三章 研究背景 6
 3.1 景深圖 6
 3.2 深度學習 7
  3.2.1 監督式學習 7
  3.2.2 非監督式學習 8
  3.2.3 強化式學習 9
 3.3 類神經網路組成 10
  3.3.1 卷積層(Convolution Layer) 10
  3.3.2 池化層(Pooling Layer) 11
  3.2.3 整流線性單位函數(ReLU) 11
  3.2.4 S 函數(Sigmoid) 12
  3.2.5 全連接層(Fully Connected Layer) 13
  3.2.6 歸一化指數函數(Softmax) 14
  3.2.7 RCNN 15
  3.2.8 Fast RCNN 15
  3.2.9 Faster RCNN 16
  3.2.10 Mask RCNN 17
第四章 研究方法 19
 4.1 選擇訓練樣本 20
 4.2 圖片預處理 21
 4.3 Mask RCNN 訓練 23
 4.4 Mask RCNN 測試 25
第五章 研究結果 26
第六章 結論與未來工作 73
參考文獻 74
J. Redmon, S. Divvala, R. Girshick & A. Farhadi(2016). You Only Look Once: Unified, Real-Time Object Detection. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 779-788. doi: 10.1109/CVPR.2016.91.
R. Girshick, J. Donahue, T. Darrell & J. Malik(2014). Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation. 2014 IEEE Conference on Computer Vision and Pattern Recognition. 580-587. doi: 10.1109/CVPR.2014.81.
R. Girshick(2015). Fast R-CNN. 2015 IEEE International Conference on Computer Vision (ICCV). 1440-1448. doi: 10.1109/ICCV.2015.169.
S. Ren, K. He, R. Girshick & J. Sun(2016). Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. IEEE Transactions on Pattern Analysis and Machine Intelligence,39(6), 1137-1149. doi: 10.1109/TPAMI.2016.2577031.
K. He, G. Gkioxari, P. Dollár & R. Girshick(2017). Mask R-CNN. 2017 IEEE International Conference on Computer Vision (ICCV). 2980-2988. doi: 10.1109/ICCV.2017.322.
T. Lin, P. Dollár, R. Girshick, K. He, B. Hariharan & S. Belongie(2017). Feature Pyramid Networks for Object Detection. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 936-944. doi: 10.1109/CVPR.2017.106.
W. Zhou, X. Li & D. Reynolds(2017). Guided deep network for depth map super-resolution: How much can color help?. 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 1457-1461. doi: 10.1109/ICASSP.2017.7952398.
Y. Yu, Q. Zhang, H. Wu & Z. Jiao(2019). License Plate Location Based on Combination of Deep Learning and Feature Fusion. 2019 10th International Conference on Information Technology in Medicine and Education (ITME). 684-687. doi: 10.1109/ITME.2019.00157.

CROWD FAVORITE(2014)。運用 cuDNN 深度神經網路函式庫加速機器學習。取自https://blogs.nvi
吳侑霖(2018)。以深度學習結合影像分類實現自動駕駛系統。元智大學通訊工程研究所碩士論文,桃園市。取自https://hdl.handle.net/11296/9ucbtd。
沈明訢(2017)。以階層式深度卷積網路實現少樣本的人臉辨識系統。國立中央大學資訊工程研究所碩士論文,桃園市。取自https://hdl.handle.net/11296/smezmg
洪啟綸(2018)。基於深度學習之人員追蹤辨識系統。國立中央大學電機工程學系碩士論文,桃園市。取自 https://hdl.handle.net/11296/z75uhu
唐嘉梅(2018)。深度學習於醫學影像處理之應用。國立中央大學資訊工程學系碩士論文,桃園市。取自 https://hdl.handle.net/11296/2v6d3y
陳己珮(2018)。結合深度學習與光流法於行人影像追蹤。國立中正大學資訊管理研究所碩士論文,嘉義縣。取自https://hdl.handle.net/11296/7antzf
葉冠志(2017)。在景深圖中使用三維連通法的物件追蹤之研究。國立屏東大學資訊工程學系碩士論文,屏東市。取自https://hdl.handle.net/11296/3jmqgr
蕭春元(2018)。人工智慧及擴增實境的自拍系統。國立臺灣科技大學資訊管理系碩士論文,台北市。取自 https://hdl.handle.net/11296/prce6r
電子全文 電子全文(網際網路公開日期:20250615)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊