跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.172) 您好!臺灣時間:2025/09/12 10:46
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:葛學文
研究生(外文):Ge, Shiue-Wen
論文名稱:美國職棒大聯盟之球隊績效和球員能力資料採礦
論文名稱(外文):Statistical Data Mining of Team Performance and Player Ability in Major League Baseball, 2010-2013
指導教授:林雅俐林雅俐引用關係
指導教授(外文):Lin, Ya-Li
口試委員:黃連成楊惠齡溫照華
口試委員(外文):Hwang, Leng-ChengYang, Hui-LingWen, Chao-hua
口試日期:2014-01-16
學位類別:碩士
校院名稱:東海大學
系所名稱:統計學系
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2014
畢業學年度:102
語文別:中文
論文頁數:60
中文關鍵詞:美國職棒大聯盟資料採礦績效防禦率攻擊指數對戰同分區球隊之勝率
外文關鍵詞:Major League Baseball (MLB)Data MiningPerformanceEarned Run Average (ERA)On-base percentage Plus Slugging Percentage (OPS)Winning percentage with the same district
相關次數:
  • 被引用被引用:10
  • 點閱點閱:1345
  • 評分評分:
  • 下載下載:172
  • 收藏至我的研究室書目清單書目收藏:1
本研究以2010至2013年美國職棒大聯盟三十支球隊,團隊年度打擊、投球和守備紀錄,運用資料採礦的技術探討影響球隊績效---晉級季後賽之關鍵因素為目的;另一個目的為針對球員打擊與投球記錄,評估打者、先發投手和後援投手的能力。在球隊績效的部份,透過決策樹分類後,結果顯示,卡方自動交互檢測、分類與迴歸樹兩種演算法較適合分類2010至2013年美國職棒大聯盟之球隊資料,防禦率和攻擊指數對戰同分區球隊之勝率建構模型二作預測效果的比較。經研究結果發現美國職棒大聯盟2010至2013年球季,球隊攻擊指數、防禦率和對戰同分區球隊之勝率,在這四年間是球隊能否晉級季後賽最關鍵的因素。球員能力的部份,將球員分類為打者、先發投手與後援投手,透過集群分析分別將其分群。比較不同分群球員能力之差異,運用因素分析將打擊和投球的記錄簡化為較少的因素並計算其分數,經過加權平均建立2013年各個分群的打者、先發投手與後援投手評分卡。
The records of hitting, pitching and fielding for Major League Baseball (MLB) in 2010-2013 were used in this research. The purpose of this research is to analyze what is the most important factor affecting the team performance---advance to postseason by the technique of data mining. Another purpose in this research is to use the records of player evaluate the ability of players. In the part of team performance, through the decision tree classification, we got the pivotal factors which were Earned Run Average (ERA) and On-base percentage Plus Slugging Percentage (OPS). Then using two factors to construct the logistic regression and Team winning percentage with the same district were considered to construct the other logistic regression. According to the result, how to improve the OPS, suppress competitor’s batter for reducing the earned run and the team winning percentage with the same district were important in 2010-2013 MLB. In addition, the results of cluster analysis indicate the heterogeneity of the player’s ability for the roles of batters, start pitches, and relief pitchers. The scoring systems are built using factor analysis using the data of 2010~2012 year for batters, start pitchers, and relief pitchers, respectively. It is good enough to support the predicted scores for the performance of most players in 2013.
目錄

摘要.............................................................................................i
Abstract.......................................................................................ii
圖目錄........................................................................................vi
表目錄........................................................................................vi

第一章 緒論
1.1 研究背景與動機….......................................................................1
1.2 研究目的……................................................................................2

第二章 文獻探討
2.1 球隊績效之相關文獻..................................................................3
2.2 球員能力之相關文獻..................................................................4

第三章 研究方法
3.1 資料來源......................................................................................6
3.2 研究範圍和限制..........................................................................7
3.3 名詞解釋......................................................................................7
3.3.1 打擊(Hitting) ..................................................................7
3.3.2 投球(Pitching) ................................................................8
3.3.3 守備(Fielding) ................................................................9
3.4 統計方法....................................................................................10
3.4.1集群分析...........................................................................10
3.4.2決策樹...............................................................................11
3.4.3邏輯斯迴歸分析...............................................................15

第四章 球隊績效之結果與討論
4.1 球隊表現之初步資料探勘............................................................17
4.1.1 2010-2013年大聯盟球隊表現之資料探勘...................17
4.1.2 球隊表現與勝率的關聯性分析…….............................26
4.1.3 球隊晉級季後賽之勝率比較.........................................28
4.2球隊晉級季後賽之決策樹模型配適............................................30
4.3邏輯斯迴歸模式的建構.................................................................36
4.4 球隊績效之討論........................................................................38

第五章 球員能力之結果與討論
5.1 球員表現之敘述性統計................................................................40
5.1.1 2010-2012年大聯盟打者表現之敘述統計...................40
5.1.2 2010-2012年大聯盟先發投手表現之敘述統計...........41
5.1.3 2010-2012年大聯盟後援投手表現之敘述統計...........42

5.2 球員能力集群分析….................................................................43
5.2.1 打者的集群分析..............................................................43
5.2.2 投手能力的集群分析......................................................45

5.3 球員能力評分卡分析................................................................48

第六章 結論與後續研究
6.1 結論................................................................................................56
6.2 後續研究........................................................................................58

參考文獻......................................................................................................59

1.Annala, C. N. and Winfree, J. ( 2011 ), “Salary distribution and team performance in Major League Baseball”, Sport Management Review, 14 ,pp. 167-175.
2.Agresti, A. ( 2002 ), Categorical Data Analysis, Second Edition, John Wiley & Sons, Inc., pp.165-324.
3.Johnson, R. A. and Wichern, D. W. ( 2007 ), Applied Multivariate Statistical Analysis-Sixth Edition, Pearson Education,Inc.
4.MLB.com: The Official Site of Major League Baseball ( 2013 ), http://mlb.mlb.com/home
5.MLB.com: The Official Site of Major League Baseball---NEWS ( 2013 ), http://mlb.mlb.com/mlb/history/mlb_history_teams.jsp
6.MLB.com: The Official Site of Major League Baseball---STATS ( 2013 ), http://mlb.mlb.com/stats/league_leaders.jsp?c_id=mlb&tcid=mm_mlb_stats
7.Papps, K. L. ,Bryson, A. and Gomez, R. ( 2011 ), “Heterogeneous worker ability and team-based production: Evidence from major league baseball, 1920-2009.” Labour Economics, 18 ,pp. 310-319.
8.Tufféry, S. ( 2011 ), Data Mining and Statistics for Decision Making-First Edition, John Wiley & Sons, Ltd. Published, pp.313-548.
9.Ward, Jr. , J. H. ( 1963 ), “Hierarchical Grouping to Optimize an Objective Function.” Journal of the American Statistical Association, 58 ,pp. 236-244.
10.林師模、陳苑欽 ( 2003 ),「Multivariate Analysis in Management」,雙葉書廊有限公司。
11.林文斌 ( 2004 ),「運用資料包絡分析法評估2003年中華職棒大聯盟投手球員績效表現」,大專體育學刊第6卷第3期,pp. 119-131。
12.姚瑞博 ( 2009 ),「影響我國職棒比賽勝負因素分析-以中華職棒大聯盟2008年球季為例」,碩士論文,中國文化大學。
13.邱企彬 ( 2012 ),「2001-2010美國職棒大聯盟球員打擊率之研究」,碩士論文,台北市立體育學院。
14.曾淑峰、林志弘、翁玉麟 ( 2012 ),「資料採礦應用-以SAS Enterprise Miner為工具」,梅霖文化。
15.中華職棒大聯盟全球資訊網---新聞NEWS ( 2013/3/9 ),http://www.cpbl.com.tw/news/Newsread1.asp?Nid=11218&Syear=2013&Smonth=3&Qyear=&Qmonth=&JPage=3&sTitle=&NewType=
16.台灣棒球維基館---統計用語 ( 2007 ) ,http://twbsball.dils.tku.edu.tw/wiki/index.php/分類:統計用語
17.維基百科---ROC曲線圖 ( 2013 ) ,http://zh.wikipedia.org/wiki/ROC曲線

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top