(3.232.129.123) 您好!臺灣時間:2021/03/06 01:41
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:陳奕璋
研究生(外文):CHEN, YI-ZHANG
論文名稱:分散式智慧於合作式機器人之應用–以三對三足球競賽為例
論文名稱(外文):Application of Cooperative Robots Based on Distributed Intelligence – in Three-on-Three Soccer Robot Competition
指導教授:林金玲林金玲引用關係
指導教授(外文):LIN, JIN-LING
口試委員:黃國勝羅梅君
口試日期:2018-01-25
學位類別:碩士
校院名稱:世新大學
系所名稱:資訊管理學研究所(含碩專班)
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2018
畢業學年度:106
語文別:中文
論文頁數:59
中文關鍵詞:分散式智慧合作式機器人增強式機器學習足球機器人
外文關鍵詞:Distributed IntelligenceCooperative RobotsReinforcement LearningRobot Soccer
相關次數:
  • 被引用被引用:0
  • 點閱點閱:94
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本研究旨在探討如何將分散式智慧應用於多機器人的合作,並以三對三機器人足球競賽為實驗模擬的對象。研究中使用增強式學習的機制,推導分散式智慧的多機器人合作演算法,讓多機器人學習踢球、搶球、追球、阻擋和整隊等五種行為,以合作完成足球競賽。
研究中,透過 Webots 模擬個別機器人使用本身的全向式攝影機截取球賽的動態環境,獲取球、隊友及敵方的位置,作為最佳策略選取以及隊形成本評估的依據,達成隊形指派與球賽獲勝的目標;最後透過 Webots 模擬三對三足球機器人競賽的案例,以驗證所提出的多機器人合作分散式智慧系統的實用性與有效性。
This research focused on how to apply distributed intelligence to cooperative robots such that the learned robots can efficiently perform on the three-on-three robot soccer competition. First, the distributed intelligence algorithm, based on reinforcement learning, was derived for primitive actions and complicated behaviors of cooperative robots. Then, the application of distributed intelligence in three-on-three robot soccer competition was conducted by weighted behavior Q-Learning approach. Finally, to validate the proposed learning approach of distributed intelligence, computer programs were developed to simulate the three-on-three robot soccer competition.
目錄
摘要 i
Abstract ii
目錄 iii
圖目錄 v
表目錄 vii
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
1.3 論文架構 2
第二章 文獻探討 3
2.1 機器人自主學習 3
2.2 合作式機器人 9
2.3 隊形的位置分配 11
第三章 研究範圍與限制 14
3.1 研究範圍 14
3.2 研究限制 14
第四章 研究方法 16
4.1 隊形位置指派 16
4.2 Q-Learning機器人自主學習 19
4.3 WBQL團隊合作 24
第五章 模擬實驗與結果分析 33
5.1 實驗一—隊形指派 34
5.2 實驗二—合作式機器人自主學習機制 42
5.3 實驗三—有經過學習與無經過學習的足球競賽 44
第六章 結論 46
參考文獻 47

圖目錄
圖 2 1 基因演算法之流程圖 4
圖 2 2 模糊系統架構之流程圖 5
圖 2 3 M-P Model 6
圖 2 4 增強式學習中代理人與環境的關係 7
圖 2 5 Q-Learning之流程圖 8
圖 2 6 分散式智慧系統分類圖 9
圖 2 7 擴展的分散式智慧系統分類圖 10
圖 2 8 合作學習架構 11
圖 2 9 集中式監控的足球競賽環境架構 12
圖 2 10 匈牙利演算法流程圖 13
圖 4 1 三對三足球隊形 16
圖 4 2 隊形選擇規則 17
圖 4 3 隊形指派流程圖 18
圖 4 4 球門角度 19
圖 4 5 六種狀態示意圖 20
圖 4 6 影像前處理流程 21
圖 4 7 狀態判斷的條件 22
圖 4 8 射門動作流程圖 23
圖 4 9 碰撞犯規 23
圖 4 10 向球前進動作流程圖 24
圖 4 11 搶球行為示意圖 25
圖 4 12 踢球行為示意圖 25
圖 4 13 阻擋行為示意圖 26
圖 4 14 追球行為示意圖 26
圖 4 15 整隊行為示意圖 27
圖 4 16 WBQL流程圖 31
圖 5 1 E-Puck 34
圖 5 2 分散隊伍 35
圖 5 3 由2-1隊形轉換為1-2隊形 35
圖 5 4 由3-0隊形轉換為1-2隊形 36
圖 5 5 由左低右高隊形轉換為 1-2 隊形 36
圖 5 6 由左高右低隊形轉換為 1-2 隊形 37
圖 5 7 由 1-2 隊形轉換為 2-1 隊形 38
圖 5 8 由 3-0 隊形轉換為 2-1 隊形 38
圖 5 9 由左低右高隊形轉換為 2-1 隊形 39
圖 5 10 由左高右低隊形轉換為 2-1 隊形 39
圖 5 11 由1-2隊形轉換為 3-0 隊形 40
圖 5 12 由2-1隊形轉換為 3-0 隊形 40
圖 5 13 由左低右高隊形轉換為 3-0 隊形 41
圖 5 14 由左高右低隊形轉換為 3-0 隊形 41
圖 5 15 自己持球狀態的權重收斂圖 43
圖 5 16 隊友持球狀態的權重收斂圖 43
圖 5 17 無人持球狀態的權重收斂圖 43
圖 5 18 敵方持球狀態的權重收斂圖 44


表目錄
表 3 1 FIRA RobotSot環境限制 15
表 3 2 FIRA RobotSot機器人限制 15
表 4 1 搶球和追求行為相關動作獎懲表 28
表 4 2 踢球、阻擋和列隊行為相關動作獎懲表 29
表 4 3 行為獎懲表 29
表 5 1 電腦規格 33
表 5 2 軟體規格 33
表 5 3 E-Puck規格 33
表 5 4 研究環境與機器人限制 34
表 5 5 隊形指派實驗結果分析 42
表 5 6 經過 WBQL 學習團隊與無任何學習團隊的比賽結果1 44
表 5 7 經過 WBQL 學習團隊與無任何學習團隊的比賽結果2 45
表 5 8 經過 WBQL 學習團隊與無任何學習團隊競賽結果比較表 45



[1] M. Kubat, An Introduction to Machine Learning, 北京: 機械工業出版社, 2016.
[2] 周志華, 機器學習, 北京: 清華大學出版社, 2016.
[3] 蘇木春、張孝德, 機器學習:類神經網路、模糊系統以及基因演算法則, 新北市: 全華圖書, 2016.
[4] J. H. Holland, Adaptation in Natural and Artificial Systems, Cambridge: MIT Press, 1992.
[5] C. &. L. J. Chen, "Hybrid optimal control of robot motor based on improved genetic algorithm and fuzzy logic," 於 International Conference on Robotics and Automation Sciences, Hong Kong, 2017.
[6] 丁介逸, "機器人動態路徑規劃之探討," 玄奘大學資訊管理學系學位論文, pp. 1-40, 2016.
[7] L. A. Zadeh, "Fuzzy Sets," Information and Control, pp. 338-353, 6 1965.
[8] 林均澤, "智慧型運動控制設計於可適應使用者特性之遙操作行走輔助機器人系統," 輔仁大學電機工程學系碩士班研究所, pp. 1-76, 2014.
[9] 陳意翔, "具智慧型停車功能車型機器人之設計與研製," 國立成功大學電機工程學系學位論文, pp. 1-120, 2002.
[10] 陳奕安, "以機器視覺結合自適應類神經模糊系統應用於草莓成熟度與果柄位置之辨識," 國立宜蘭大學, 宜蘭市, 2014.
[11] 劉天圖, "應用影像處理技術與類神經網路之智慧型除草機器人研究," 明道大學資訊傳播學系學位論文, pp. 1-70, 2013.
[12] 洪嘉祥, "應用類神經網路運算法於自主式水下載具航跡控制之研究," 國立成功大學, 台南市, 2014.
[13] 許頌伶, "利用三維模型訓練類神經網路的手勢辨識技術," 國立交通大學, 新竹市, 2016.
[14] Richard S. Sutton , Andrew G. Barto, Reinforcement Learning:An Introduction, Cambridge, Massachusetts: MIT, 2012.
[15] V. M. Babu, U. V. Krishna 且 S. K. Shahensha, "An autonomous path finding robot using Q-learning, " 於 International Conference on Intelligent Systems and Control, Coimbatore, 2016.
[16] J.-L. Lin 且 K.-S. Hwang, "Balancing and Reconstruction of Segmented Postures for Humanoid Robots in Imitation of Motion," IEEE Access, pp. 17534-17542, 22 8 2017.
[17] Enrique Bauzano, B. Estebanez, I. Garcia-Morales, Victor F. Muñoz, "Collaborative Human–Robot System for HALS Suture Procedures," IEEE Systems Journal, pp. 957-966, 2016.
[18] Jianing Chen, Melvin Gauci, Wei Li, Andreas Kolling, Roderich Groß, "Occlusion-Based Cooperative Transport with a Swarm of Miniature Mobile Robots," IEEE Transactions on Robotics, pp. 307-321, 2015.
[19] Lynne E. Parker, "Distributed Intelligence-Overview of the Field and its Application in Multi-Robot Systems," Journal of Physical Agents, pp. 5-14, 1 3 2008.
[20] Brett Browning, James Bruce, Michael Bowling, Manuela M. Veloso, "STP: Skills, Tactics and Plays for Multi-Robot Control in Adversarial Environments," IEEE Journal of Control and Systems Engineering, pp. 33-52, 2005.
[21] Hiroaki Kitano, Minoru Asada, Yasuo Kuniyoshi, Itsuki Noda, Eiichi Osawa, Hitoshi Matsubara, "RoboCup: A Challenge Problem for AI," AI MAGAZINE, pp. 73-86, 1997.
[22] P. R. &. L. P. E. Young, "Applications of a theory of automated adversarial planning to command and control," IEEE transactions on systems, man, and cybernetics, pp. 806-812, 1986.
[23] Zhou Pucheng, Shen Huiyan, "Multi-agent Cooperation by Reinforcement Learning with Teammate Modeling and Reward Allotment," in Eighth International Conference on Fuzzy Systems and Knowledge Discovery, Shanghai, 2011.
[24] 王文凱, "多代理人系統中的混合學習與合作方法," 國立台北科技大學電資碩士在職專班, 台北市, 2012.
[25] 王雅玲, "基於行為學習於多台機器人的任意隊形排列," 國立中正大學工學院電機工程研究所, 嘉義縣, 2008.
[26] J. L. H. K. S. &. W. Y. L. Lin, "A simple scheme for formation control based on weighted behavior learning," IEEE Transactions on Neural Networks and Learning Systems, pp. 1033-1044, 2014.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔