跳到主要內容

臺灣博碩士論文加值系統

(44.212.99.248) 您好!臺灣時間:2023/01/28 13:00
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:胡舜翔
研究生(外文):HU, SHUN-HSIANG
論文名稱:XGBoost機器學習法探究學生學習狀況與未來薪資之關聯
論文名稱(外文):XGBoost, a machine learning method: An exploration the relationship between student learning status and future salary
指導教授:林惠文林惠文引用關係
指導教授(外文):LIN, HUI-WEN
口試委員:程毅豪葉麗娜
口試委員(外文):CHEN, YI-HAUYEH, LINA
口試日期:2022-04-14
學位類別:碩士
校院名稱:東吳大學
系所名稱:數學系
學門:數學及統計學門
學類:數學學類
論文種類:學術論文
論文出版年:2022
畢業學年度:110
語文別:中文
論文頁數:30
中文關鍵詞:薪資性別學測成績生活背景回歸分析
外文關鍵詞:GBDTXGBoost
相關次數:
  • 被引用被引用:0
  • 點閱點閱:96
  • 評分評分:
  • 下載下載:13
  • 收藏至我的研究室書目清單書目收藏:0
人的一生中,個人成就(一般指經濟上之)與個人生涯中的各個時間點的歷程關係一直為普羅大眾熱烈討論的焦點,各家論點與研究方向都有其舉足輕重的參考價值。因此本文將以學生時期(國高中)之背景佐以相對客觀面(性別、大學學測成績)與工作薪資之關係作為探討焦點,使用回歸檢測性別與學測成績對薪資的關聯性,發現性別與未來薪資並無明顯相關、而學測成績與未來薪資走向應有相關性;本文亦使用 XGBoost (eXtreme Gradient Boosting )將生涯問卷中各項生活背景與薪資進行分類分析,觀察出生活背景與個人學習狀況確實與未來工作薪資有相關性。盼以本文之探討方向及結論,提供一相對客觀之論述與作為參考資料。
It is a hotly debated topic among the relationship between personal life backgrounds and the income of work. All the points of view about this subject of study are very referential. This study applied regression to evaluate the relationship between gender and the income, and the relationship between the score of College Entrance Examination and the income, also used the XGBoost (eXtreme Gradient Boosting) model to classify the relationship between the life backgrounds and the income. We found that it is not obviously positively relative between gender and income, but it seems to be relative between the score of College Entrance Examination and the income. The XGBoost model showed that there are indeed some correlations between some subjects of life background and the income. Through the above progress and opinions, we wish to provide a referential resource for scholars.
誌謝 i
摘要 ii
Abstract iii
目次 iv
表目次 vi
圖目次 vii
第一章 緒論 1
1.1 研究背景與動機 1
1.2 資料說明 1
1.3 研究方法 1
1.3.1 回歸分析 2
1.3.2 XGBoost(eXtreme Gradient Boosting) 2
1.4 研究內容與流程圖 3
第二章 文獻回顧 4
2.1 基礎統計資料 4
2.1.1 大學入學測驗(the Examination of College Enterance) 6
2.1.2 『台灣教育長期追蹤資料庫』後續調查 7
2.2 線性回歸 7
2.3 GBDT(Gradient Boosting Decision Tree) 8
2.4 XGBoost(eXtreme Gradient Boosting) 8
2.4.1 XGBoost目標函數推導 9
第三章 資料分析 11
3.1 資料清洗、探勘、分析 11
3.2 線性回歸與 p value 13
3.2.1 性別與薪資之關聯 14
3.2.2 大學學測成績與薪資之關聯 16
3.3 XGBoost 17
3.3.1 篩選變量 17
3.3.2百分比長條圖 21
3.3.2.1 影響變量1:工作類別 21
3.3.2.2 影響變量2:經歷工作數 22
3.3.2.3 影響變量3:畢業文憑(學歷) 23
3.3.2.4 影響變量4:職業認同與歸屬感 24
3.3.2.5 影響變量5:配偶(交往對象)的教育程度(學歷) 25
3.3.2.6 影響變量6:畢業主修領域 26
3.3.2.7 影響變量7:母親教育程度(學歷) 27
3.4 Multinomial Logistic Regression 28
第四章 結論與建議 29
4.1 結論 29
4.2 建議 29
參考文獻 30
[1] 勞動部全球資訊網中文網 https://www.mol.gov.tw
[2] 謝明彧(2021-02-18)。「2021起薪最佳大學」大數據報告。2021大學暨技職入學指南。
[3] 關秉寅(2015)。「『台灣教育長期追蹤資料庫』後續調查:教育與勞力市場的連結」- 2001/2003年高中職五專學生樣本2009年電訪調查(Panel-1 SH)(公共版)。
[4] 關秉寅(2015)。「『台灣教育長期追蹤資料庫』後續調查:教育與勞力市場的連結」- 2001/2003年高中職五專學生樣本2010年調查(Panel-1 SH)(公共版)。
[5] 關秉寅(2015)。「『台灣教育長期追蹤資料庫』後續調查:教育與勞力市場的連結」- 2001/2003年高中職五專學生樣本2015年調查(Panel-1 SH)(公共版)。
[6] Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and regression trees. London, UK: Chapman & Hall/CRC.
[7] Firedman, J. H. (1999). Greedy function approximation: A gradient boosting machine.
[8] Chen, Tianqi (2016). XGBoost: A Scalable Tree Boosting System.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top