跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.82) 您好!臺灣時間:2024/12/04 23:31
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:馮瑞祥
研究生(外文):Fong, Ruei-Shiang
論文名稱:運用資料探勘技術於職棒比賽勝負預測之研究-以美國職棒大聯盟為例
論文名稱(外文):Studies on Predicting the Outcome of Professional Baseball Games with Data Mining Techniques: MLB as a Case
指導教授:黃謙順黃謙順引用關係
指導教授(外文):Hwang, Chein-Shung
口試委員:蘇耀新蘇意晴
口試委員(外文):Su, Yau-shinSu, Yi-Ching
口試日期:2012-06-20
學位類別:碩士
校院名稱:中國文化大學
系所名稱:資訊管理學系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:79
中文關鍵詞:類神經網路資料探勘技術比賽預測資料分析
外文關鍵詞:Artificial Neural NetworkData Mining TechniquesGame PredictionData Analysis
相關次數:
  • 被引用被引用:20
  • 點閱點閱:3164
  • 評分評分:
  • 下載下載:510
  • 收藏至我的研究室書目清單書目收藏:0
職棒比賽非常注重數據收集及分析,因此每場比賽都會產生大量可供分析的數據。資料探勘技術是一項可在浩瀚的資料中分析出關鍵結果的電腦分析技術,以此技術來處理職棒的資料,不但可獲佳效,更可免去人工分析所產生的錯誤。本研究目的即是利用資料探勘的技術預測美國大聯盟職棒賽事之勝負與得分。

本研究以美國職棒大聯盟30支隊伍在2000到2012年所有例行賽賽事為研究對象,投入之變數,為各隊賽前十場比賽野手與投手各項表現之加總平均數。首先使用「皮爾森積差相關分析」除去與勝負較無相關之變數與具有複共線性之變數,以挑選出適當之投入變數,再利用「類神經網路」中的「倒傳遞網路」將挑選出之變數投入並建立模型。以前100場作為模型之訓練集,剩下62場投入模型之鑑效,取得比賽之預測比分後,再和實際比賽結果和賭盤之盤口作比較。

實證結果利用產出之模型得到之主客隊預測比分,再與運動彩券的大小、勝分差、讓分盤口比較後,證實本研究所提出的模型有較佳的預測準確率。後續研究者或可改變投入之變數值,再代入本研究提出的模型,應可提升預測的準確率。

Professional baseball games emphasize data collection and analysis because each game provides plenty of data that needs to be analyzed. Data mining methods involve computer analysis techniques with which a crucial outcome can be found from a huge amount of data. The data mining techniques thus can be used to efficiently analyze the data of professional baseball and also avoid the mistakes often caused by manual analysis. This study aims to predict the outcome and scores of professional baseball games in MLB.

The data of the study are all the regular season games from 2000 to 2012 of thirty teams in MLB. The variables are the average statistics of both the fielders’ and the pitchers’ performances in the last ten games. First, we used the Pearson product-moment correlation coefficient to delete the unrelated variables and variables of multicollinearity and to select the suitable variables. Then we applied the Back Propagation Network (BPN) of the artificial neural network to build a model for the selected variables. The first 100 games served as the training set of the model while the later 62 games as the validation set. After obtaining the predicted scores of each game, we compared them to the real outcome of the games and the money line.

After using the output model to predict the scores of the host and the guest, we further compared them with the real outcome, run line, and money line of sports gambling. The experimental results have proven that the model of this study provided better prediction accuracy. Follow-up researchers may consider using different variables for the model to improve the accuracy of the predictions.

中文摘要......................... i

英文摘要......................... ii

誌謝辭.......................... iii

內容目錄......................... iv

表目錄.......................... vi

圖目錄.......................... vii

第一章  緒論...................... 1

  第一節  研究背景與動機............... 1

  第二節  研究目的.................. 2

  第三節  研究範圍與限制............... 3

  第四節  研究流程.................. 3

  第五節  論文架構.................. 4

第二章  文獻探討.................... 5

  第一節  資料探勘技術................ 5

  第二節  棒球比賽.................. 11

  第三節  臺灣運動彩券................ 24

第三章  研究方法.................... 27

  第一節  研究步驟與架構............... 27

  第二節  研究資料來源及內容............. 28

  第三節  資料庫及資料前置處理............ 29

  第四節  研究變數.................. 32

第四章  實證結果與分析................. 37

  第一節  變數的相關分析............... 37

  第二節  類神經網路................. 41

  第三節  類神經網路設定............... 43

  第四節  產出圖表.................. 47

  第五節  大小盤口預測產出結果............ 52

  第六節  讓分盤口預測產出結果............ 53

  第七節  勝分差盤口預測產出結果........... 54

  第八節  實證研究結果................ 55

第五章  結論與建議................... 56

參考文獻......................... 58

附錄........................... 63
  附錄一  打擊(Batting)棒球術語一覽表....... 63

  附錄二  投球(Pitching)棒球術語一覽表....... 65

  附錄三  守備(Fielding)棒球術語一覽表....... 67

  附錄四  年度守備資料表欄位............. 68

  附錄五  年度打擊資料表欄位............. 69

  附錄六  年度投球資料表欄位............. 70

  附錄七  年度賽程資料表欄位............. 71

  附錄八  每日賽程野手資料表欄位........... 72

  附錄九  每日賽程投手資料表欄位........... 74

  附錄十  運動彩券資料表欄位............. 76

  附錄十一 變數與得分、失分間之相關性......... 77


一、中文部份
大A運動網(2008),2008 MLB運動彩券簽注手冊,台北:意象文化。
尹相志(2009),SQL Server 2008 Data Mining資料採礦,台北:悅知文化。
王禹斌(2006),美國職棒大聯盟球隊之技術效率分析,國立中正大學國際經濟所碩士論文。
王祖傑(2008),以資料探勘技術探討影響職業棒球比賽勝負因素之研究,中國文化大學資訊管理研究所碩士論文。
吳佳芳(2003),職業棒球之經營效率比較,國立中正大學國際經濟研究所碩士論文。
林文斌、鄧元湘(2000),長打率在現代棒球中扮演的角色。德明學報,16,315-323。
林俊騰(2011),應用決策樹與類神經預測台指期貨隔日漲跌之研究,彰化師範大學資訊管理學系碩士論文。
林惟璁(2005),職業棒球球員績效評估模式建立之研究─模糊多評準決策之應用,國立嘉義大學休閒事業管理研究所碩士論文。
林閔鉫(2003),美國職棒大聯盟球隊經營管理效率分析,東吳大學經濟學系碩士論文。
邱顯銘(2010),運用資料探勘技術分析運動彩券盤口推測,中國文化大學資訊管理研究所碩士論文。
姚瑞博(2009),影響我國職棒比賽勝負因素分析-以中華職棒大聯盟2008年球季為例,中國文化大學運動教練研究所碩士論文。
范盛傑(2011),新竹地區運動彩券消費者購買動機、涉入程度與消費行為之研究,國立臺灣師範大學體育學系碩士論文。
翁慈宗(2009),資料探勘的發展與挑戰,科學發展,442,33-39。
張德鋒、郭玉霞、宋志剛(2005),數據挖掘技術,航空計算計術,35,76-79。
陳冠語(2010),薪資結構對組織績效的影響-以NBA及MLB為例,國立中央大學產業經濟研究所碩士論文。
陳華總(2009),運動影片內容分析、理解與註釋之研究,國立交通大學資訊科學與工程研究所博士論文。
陳麒文(2011),資料採礦於職業棒球勝隊預測模式之建構,國立體育大學體育研究所博士論文。
曾韋翔(2007),職棒球員生涯表現分析,國立臺灣體育學院運動管理學系碩士論文。
程紹同、方信淵、洪嘉文、廖俊儒、謝一睿(2001),運動行銷商戰剖析,台北:漢文書店。
楊意婷(2011),Probit迴歸模型與羅吉斯迴歸模型預測理論之研究-以美國職棒大聯盟為例,清雲科技大學財務金融研究所碩士論文。
葉志仙(1995),中、美職棒運動比賽成績記錄分析研究,台北:一品文化事業有限公司。
葉志仙(1989),棒球運動守備戰術之理論與實際,台北:一品文化事業有限公司。
葉益銘、楊朝行、陳寶源(2008),我國甲組成棒球隊攻擊能力與比賽勝率相關之研究,高應科大體育學刊,7,268-277。
葉麗琴(1996),慢式壘球記錄法之研究分析,台灣體育,85,50-53。
劉世慶(2011),運動產業之倫理問題探究,國立中央大學哲學研究所博士論文。
謝嘉峰(2010),MLB球員在合約年與非合約年效率衡量之研究,國立政治大學會計學系碩士班論文。
藍天勇(2010),本土職棒野手打擊表現與隔年薪資之分析研究,國立嘉義大學體育與健康休閒研究所碩士論文
顏秀姿(2006),2004年雅典奧運女子壘球選手不同投打習慣打擊能力與勝負之分析研究,輔仁大學體育研究所碩士論文。


二、英文部份
Barker, D. G., (1964). The factor structure of major league baseball records. Research Quarterly, 35(1), 75-79.
Berry, M. J. A., Linoff, G. S., (1997). Data mining techniques: For marketing, sales, and customer support. Datenbank Rund-brief, 21(1), 90-91.
Cabena, P., Hadjnian, P., Stadler, R., Verhees, J., Zanasi, A., (1997). Discovering Data Mining from Concept to Implementation. (Vol. 1). Upper Saddle River, NJ: Prentice Hall.
Friedman, J.H., (1998). Data mining and statistics: What's the connection? Computing Science and Statistics: Proceedings of the 29th Symposium on the Interface.
Han, J., (1999). Data Mining. J. Urban and P. Dasgupta (eds.), Encyclopedia of Distributed Computing.
Scully, G. W., (1974). Pay and performance in Major League Baseball. The American Economic Review, 64(6), 915-930.


三、網頁部份
王俊明(2010, Apr 3),各項統計方法的使用目的及使用時機,http://mail.leader.edu.tw/~tlhwu/statistics.htm
教育部體育署:運動彩券盈餘公告表(2013, Jun 7)
http://www.sa.gov.tw/menu.aspx?wmid=690
傅粹馨(2010, Apr 3),多元迴歸分析中之結構係數與逐步迴歸,http://w2.nioerar.edu.tw/basis3/11/gf7.htm
運動彩券(2013, Jun 1)
http://www.i-win.com.tw
Baseball Almanac (2013, May 29),http://www.baseball-almanac.com
Baseball-Reference (2013, May 29),
http://www.baseball-reference.com
Retrosheet (2012, Jun 10),http://www.retrosheet.org
Sean Lahman (2010, Apr 3),The Lahman Baseball Database,http://www.baseball1.com
The Official Site of Major League Baseball (2012, Jun 10),http://mlb.mlb.com/index.jsp

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top