(3.238.186.43) 您好!臺灣時間:2021/02/26 12:59
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:游廷鈞
研究生(外文):YU, Ting-Chun
論文名稱:基因演算法結合支持向量機應用於預測美國大聯盟季後賽隊伍
論文名稱(外文):Forecasting MLB Playoff Teams Using GA-SVM
指導教授:洪瑞鍾
指導教授(外文):Hung, Jui-Chung
口試日期:2017-11-19
學位類別:碩士
校院名稱:臺北市立大學
系所名稱:資訊科學系碩士在職專班
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2017
畢業學年度:106
語文別:中文
論文頁數:37
中文關鍵詞:基因演算法支持向量機特徵選取美國職棒大聯盟
外文關鍵詞:Genetic AlgorithmSupport Vector MachineFeature SelectionMajor League Baseball
相關次數:
  • 被引用被引用:1
  • 點閱點閱:176
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:24
  • 收藏至我的研究室書目清單書目收藏:1
本研究提出如何有效地預測美國大聯盟季後賽隊伍。一般而言美國大聯盟的相關棒球數據是非常繁多且複雜,導致球迷和觀眾很難解讀這些棒球數據並做有效的預測分析,因為預測過程中若包含太多無效特徵是會影響到分類器的正確度、計算時間和效能,因此本研究提出一種名為GA-SVM的預測模型應用於預測美國大聯盟的季後賽隊伍。
基因演算法 (Genetic Algorithm, GA) 是一種常用於特徵篩選的演化式計算,它可以先篩選刪除無效特徵並且保留有效的特徵;支持向量機 (Support Vector Machine, SVM) 可以實行訓練資料群的分類並提升最後的分類正確率。
如以上所述,本研究結合基因演算法和支持向量機的優點去進行季後賽分析並避免過適和局部最佳解的問題。為了此研究並蒐集1995~2015年的美國大聯盟隊伍所有的打擊、投球、防守的數據並去建立一個有效的分析模型。
最後使用GA-SVM預測模型並用傳統的支持向量機和C4.5做為參考基準。測試資料共有58項棒球紀錄並再經由基因演算法篩選出有效的特徵,最後得到有價值的棒球特徵約為總特徵數的百分之二十且預測準確度可達到91.51%,由此推論GA-SVM模型已具備判斷大聯盟季後賽隊伍的預測能力。

關鍵字:基因演算法、支持向量機、特徵選取、美國職棒大聯盟
This research studies the Major League Baseball (MLB) Playoffs forecast. In general, the MLB postseason related records are extremely numerous and complex, to predict the outcome is very difficult, especially the invalid records will also affect the accuracy, computing time, and performance of the classifier. Therefore, we proposed the method named genetic algorithm- support vector machine (GA-SVM) as the prediction method.
Generally, GA is the common filtering method, it can effectively filter to remove the invalid features, and the remaining of the valid feature can be used to predict the teams of the playoffs. The Support Vector Machine can also efficiently perform the classification of the feature filtering and then use this method to distinguish whether the MLB teams have entered the playoffs or not.
As mentioned above, this research combines the advantages of the GA and SVM to avoid the overfitting and help to do the classification. For this research, we collect all the MLB team batting, pitching and fielding records in 1995~2015 and to establish the useful classification model.
Finally, we will compare the estimated accuracy of GA-SVM with SVM and C4.5 methods. Total 58 baseball features included in the test data and then got the valid features by genetic algorithm. The number of valid features is about 20 percent of the original features and the prediction accuracy was 91.51%. Accordingly, GA-SVM model has the ability to predict the MLB playoff teams.

Keywords:Genetic Algorithm, Support Vector Machine, Feature Selection, Major League Baseball
謝誌 I
中文摘要 II
Abstract III
目次 IV
圖目次 V
表目次 VI
第一章 緒論 1
第一節 研究背景 1
第二節 研究目的 2
第三節 論文架構 3
第二章 文獻探討 4
第一節 大聯盟賽制 4
第二節 棒球統計數據 7
第三節 基因演算法應用於特徵選擇 11
第四節 支持向量機應用於運動賽事 13
第三章 研究方法 15
第一節 資料轉換與處理 16
第二節 使用基因演算法找出有價值特徵 19
第三節 用SVM對棒球數據建立分類器 23
第四節 GA-SVM架構圖 27
第四章 實驗結果 29
第一節 棒球實驗數據 29
第二節 驗證結果 30
第五章 結論與未來展望 34
參考文獻 35
一、網頁參考文獻 35
二、中文參考文獻 35
三、英文參考文獻 36
一、 網頁參考文獻
[1]富比士。線上檢索日期:2017 年 11月 30 號。網址:https://www.forbes.com/sites/maurybrown/2016/12/05/mlb-sees-record-revenues-approaching-10-billion-for-2016/#652a36227088
[2]Legal Sports Repot。線上檢索日期:2017 年 11月 30 號。網址:http://www.legalsportsreport.com/12497/nevada-sports-betting-november-2016/
[3]Baseball-Reference。線上檢索日期:2017 年 11月 30 號。網址:http://www.baseball-reference.com
[4]台灣棒球維基館。線上檢索日期:2017 年 11月 30 號。網址:http://twbsball.dils.tku.edu.tw/wiki/index.php/分類:術語
[5]MathWorks-MATLAB。線上檢索日期:2017 年 11月 30 號。https://cn.mathworks.com/help/gads/genetic-algorithm-options.html
[6]支持向量機通俗導論(理解SVM的三層境界) 。
線上檢索日期:2017 年 11月 30 號。網址:https://raw.githubusercontent.com/.../Intro2SVM/master/Intro2SVM.pdf

二、中文參考文獻
[7]董森堡,李文良,& 黃仲凌。(2011)。建構MLB球隊晉級季後賽之區別分析預測模式。台北:國立金門大學觀光管理研究所學位論文。
[8]王彥傑,& 鄭士康。(2016)。以統計分析和機器學習預測美國職棒大聯盟季後賽資格。台北:臺灣大學電信工程學研究所學位論文。
[9]許昭彥。(1995)。美國棒球(二)。台北:聯經出版社。
[10]陸永強。(1996)。美國職棒葵花寶典。台北:野球人出版。
[11]曾文誠,& 曹玉烱。(2013)。圖解MLB【修訂新版】。好讀出版社。
[12]張廖年鴻,& 白炳豐。(2013)。混合式支援向量機與決策樹模型於籃球比賽結果分析之應用。台北:國立暨南國際大學資訊管理研究所學位論文。
[13]林豐澤。(2005)。演化式計算上篇: 演化式演算法的三種理論模式。台北:智慧科技與應用統計學報。
[14]鄭捷。(2016)。今天不學機器學習,明天就被機器取代:從Python入手+演算法。台北:佳魁資訊出版社。

三、英文參考文獻
[15]James, B. (1988). The Bill James historical baseball abstract. US: Random House Incorporated.
[16]Quinlan, J. R. (2014). C4. 5: programs for machine learning. Elsevier.
[17]Darwin, C., & Bynum, W. F. (2009). The origin of species by means of natural selection: or, the preservation of favored races in the struggle for life. New York: AL Burt.
[18]Holland, J. H. (1992). Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control, and artificial intelligence. US: MIT press.
[19]Grefenstette, J. J. (1992, September). Genetic algorithms for changing environments. Ireland: In PPSN (Vol. 2, pp. 137-144).
[20]Zhong, M. H., Hung, J. C., Yang, Y. C., & Huang, C. P. (2016, November). GA-SVM classifying method applied to dynamic evaluation of taekwondo. In Advanced Materials for Science and Engineering (ICAMSE), International Conference on (pp. 534-537). IEEE.
[21]Ghamisi, P., & Benediktsson, J. A. (2015). Feature selection based on hybridization of genetic algorithm and particle swarm optimization. IEEE Geoscience and Remote Sensing Letters, 12(2), 309-313.
[22]Valdez, F., Melin, P., & Castillo, O. (2014). Modular neural networks architecture optimization with a new nature inspired method using a fuzzy combination of particle swarm optimization and genetic algorithms. Information Sciences, 270, 143-153.
[23]Caruana, R., & Niculescu-Mizil, A. (2006, June). An empirical comparison of supervised learning algorithms. In Proceedings of the 23rd international conference on Machine learning (pp. 161-168). NY: ACM.
[24]Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.
[25]Leung, C. K., & Joseph, K. W. (2014). Sports data mining: predicting results for the college football games. Procedia Computer Science, 35, 710-719.
[26]Hand, D. J., Mannila, H., & Smyth, P. (2001). Principles of data mining. US: MIT press. (pp. 31).
[27]Jain, A., Nandakumar, K., & Ross, A. (2005). Score normalization in multimodal biometric systems. Pattern recognition, 38(12), 2270-2285.
[28]Han, J., Pei, J., & Kamber, M. (2011). Data mining: concepts and techniques. Elsevier.
[29]Herrera, F., Lozano, M., & Verdegay, J. L. (1998). Tackling real-coded genetic algorithms: Operators and tools for behavioural analysis. Artificial intelligence review, 12(4), 265-319.
[30]Mitchell, M. (1998). An introduction to genetic algorithms. US: MIT press.
[31]Dantzig, G. (2016). Linear programming and extensions. US: Princeton university press.
[32]Chang, C. C., & Lin, C. J. (2011). LIBSVM: a library for support vector machines. ACM Transactions on Intelligent Systems and Technology (TIST), 2(3), 27.
[33]Holmes, G., Donkin, A., & Witten, I. H. (1994, December). Weka: A machine learning workbench. In Intelligent Information Systems, 1994. Proceedings of the 1994 Second Australian and New Zealand Conference on (pp. 357-361). IEEE.
[34]Kohavi, R. (1995, August). A study of cross-validation and bootstrap for accuracy estimation and model selection. In Ijcai (Vol. 14, No. 2, pp. 1137-1145).
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔