(3.239.56.184) 您好!臺灣時間:2021/05/13 09:55
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

: 
twitterline
研究生:陳品辰
研究生(外文):Pin-Chen Chen
論文名稱:應用資料探勘技術進行學生缺曠課對成績影響之研究
論文名稱(外文):A Study Of Influences Of Absences For The Scores Of Students By Using Data Mining Technologies
指導教授:戴建誠戴建誠引用關係黃夙賢黃夙賢引用關係
學位類別:碩士
校院名稱:明新科技大學
系所名稱:資訊管理研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:69
中文關鍵詞:資料探勘曠課OLAP群集法決策樹
外文關鍵詞:Data MiningAbsenceOLAPClusteringDecision Trees
相關次數:
  • 被引用被引用:6
  • 點閱點閱:1648
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:199
  • 收藏至我的研究室書目清單書目收藏:2
根據教育部近十年來統計,大專院校學校總數從民國87年至民國96年以來由116所學校成長為137所,大學錄取率和四技錄取率年年升高,尤其97年大學錄取率更高達97%。面對招生如此困難的惡劣環境中,許多學校開始思考著如何提升學生的學習成效,避免學生因學期成績不及格而休退學,造成學校的學生人數的減少。
影響學生最後學期成績的因素很多,但是在過去的文獻中,顯少有人探討缺曠課對於成績所造成的影響,學生是否會因為曠課頻率增加而導致成績結果不及格最後甚至退學。
於是本研究採用明新科技大學歷年學生基本資料以及成績和曠缺課紀錄資料為基礎,分析學生可能曠課的原因以及曠課的多寡對成績結果所造成的影響,以提升教學成效減少學生成績退步甚至休退學的情況發生。
本研究將資料建立資料倉儲後,運用OLAP分析曠課節數多寡和成績不及格的趨勢,並利用學生歷年的系所、住址、畢業學校…等維度進行學生曠課分析,希望能從中觀察各維度對於學生曠課的可能性。其次運用資料探勘中的群集分析法,在每個群集中挖掘出曠課學生的特質,提供這些資訊讓學校了解那類學生較易曠課,學校可針對該類學生加強點名管理。最後運用資料探勘中的決策樹方法來分析曠課的因素會對成績結果會造成那些不良的影響,並找出具有代表性意義的規則,並將這些規則加以解釋及提出建議,讓學校及師生了解曠課的原因以及所造成的不良影響。

According to the statistics of Ministry of Education, the number of universities and colleges grows from 116 to 137 in the past ten years. Most school are thinking about how to improve student's performance in order to avoid failing in examination and leaving school. There are many factors can influence scores, such as student's backgrounds, the graduated schools and the frequencies of absences…etc. There are few researches about the impacts of absences to study performance. Our research is to analyze the causes and influences of absences based on the historical data in Minghsin University of Science and Technology. Firstly, the data are cleaned for building data warehouse, and then OLAP is applied to analyze the trend of absences and failures from various dimensions, such as student’s department, address…etc. And then apply decision tree and cluster algorithm in data mining to find how absences influence the class scores. We also hope that the mining methods and results can contribute to school to reduce the number of truants and to improve the student’s study performance.
摘 要 i
Abstract ii
誌謝 iii
目 錄 iv
表目錄 vi
圖目錄 ix
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
1.3 研究範圍與限制 4
1.4 論文架構 4
第二章 文獻探討 5
2.1 資料探勘 5
2.2 資料倉儲 7
2.3 OLAP分析 8
2.3.1 OLAP的架構 8
2.3.2 OLAP的應用 9
2.4 群集分析法 12
2.5 資料分類法 17
2.6 決策樹 18
2.6.1 決策樹演算法 19
2.6.2 決策樹的修剪 21
2.7 招生策略相關研究 21
第三章 研究方法 24
3.1 資料範圍 24
3.2 研究架構 25
3.3 資料前置處理 26
3.3.1 資料整合工作 26
3.3.1.1 資料不一致 26
3.3.1.2 資料綱目重複 27
3.3.1.3 資料表合併 27
3.3.2 資料清理工作 28
3.3.2.1 資料有雜訊 28
3.3.2.2 資料不完整 28
3.3.3 資料轉換工作 29
3.3.3.1 資料一般化 29
3.3.3.2 建立新屬性 29
3.3.3.3 缺課節數分類 31
3.3.3.4 畢業學校與教師編號處理31
3.3.4 特徵屬性選取31
3.4 OLAP分析33
3.5 群集分析法34
3.6 決策樹35
第四章 研究結果36
4.1 OLAP分析36
4.1.1曠課節數與曠課人數分析36
4.1.2曠課節數與成績不及格率趨勢分析36
4.1.3曠課等級與休退學率趨勢分析37
4.1.4學生居住地區歷年曠課趨勢分析38
4.1.5 96學年度管理學院學生來源曠課趨勢分析40
4.1.6 96學年度管理學院課程學生曠課趨勢分析41
4.1.7 管理學院96學年教師授課之曠課趨勢分析42
4.2 群集分析44
4.2.1群集分析結果44
4.2.2結果解釋50
4.3 決策樹54
4.3.1成績不及格決策樹模型 54
4.3.2休退學決策樹模型 60
第五章 結論與建議 65
5.1 研究結論 65
5.2 後續研究建議 66
參考文獻 67

表目錄

表1 曠課行為與學生特質相關文獻21
表2 OLAP分析探討主題與使用維度33
表3決策樹輸入變數35
表4決策樹輸出變數35
表5日間部96學年度學生曠課率較高縣市歷年曠課率39
表6夜間部96學年度學生曠課率較高縣市歷年曠課率39
表7日間部96學年度管理學院曠課比例較高學生來源40
表8夜間部96學年度管理學院曠課比例較高學生來源40
表9日間部96學年度管理學院曠課比例較高課程名稱41
表10夜間部96學年度管理學院曠課比例較高課程名稱42
表11日間部96學年度管理學院各課程授課教師曠課比例43
表12夜間部96學年度管理學院各課程授課教師曠課比例43
表13日間部群集個數表44
表14夜間部群集個數表44
表15日間部目前科系群集分佈表45
表16夜間部目前科系群集分佈表45
表17日間部入學方式群集分佈表46
表18夜間部入學方式群集分佈表47
表19日間部學制群集分佈表47
表20夜間部學制群集分佈表47
表21日間部入學身分群集分佈表48
表22夜間部入學身分群集分佈表48
表23日間部性別群集分佈表48
表24夜間部性別群集分佈表48
表25日間部缺課類別群集分佈表49
表26夜間部缺課類別群集分佈表49
表27日間部各群集相對顯著屬性表52
表28夜間部各群集相對顯著屬性表53
表29日間部決策樹擷取之重要規則58
表30夜間部決策樹擷取之重要規則59
表31日間部決策樹擷取之重要規則63
表32夜間部決策樹擷取之重要規則64

圖目錄

圖1 大學校院新生錄取人數及錄取率2
圖2 四技二專錄取率2
圖3 飲料連鎖店銷售資料倉儲的多維度立方體9
圖4 時間維度下鑽10
圖5 時間維度上捲10
圖6 地區維度切片11
圖7 地區與時間維度切塊11
圖8 圖7做90度轉軸之結果11
圖9 k-means演算法執行步驟15
圖10 E-M演算法執行流程16
圖11 決策樹示意圖18
圖12原始資料綱要24
圖13研究架構圖25
圖14目前科系資料不一致處理結果26
圖15資料綱目重複處理結果27
圖16資料表合併結果27
圖17資料不完整處理結果28
圖18 Null處理結果29
圖19資料一般化處理結果29
圖20學生資料欄位建立新屬性結果30
圖21缺曠課資料欄位建立新屬性結果31
圖22特徵屬性篩選分割後結果32
圖23日夜間部曠課節數與曠課人數分佈圖36
圖24日間部曠課節數與成績不及格率分析圖37
圖25夜間部曠課節數與成績不及格率分析圖37
圖26日間部曠課等級與休退學率分析圖38
圖27夜間部曠課等級與休退學率分析圖38
圖28 日間部成績不及格學生之決策樹模型圖56
圖29 夜間部成績不及格學生之決策樹模型圖57
圖30日間部退學學生之決策樹模型圖61
圖31夜間部退學學生之決策樹模型圖62

[1] Hinet新聞網:http://wastimes.hinet.net/times/article.html?newsid=1798055&option=recreation
[2] 王建華,資料挖掘技術在技職院校「中途離校生」輔導之應用---以醒吾技術學院為例,國防大學國防管理學院國防資訊管理研究所,碩士學位論文,民93年
[3] 林金火,資料探勘技術應用於中學生成績之研究,立德管理學院應用資訊研究所,碩士論文,民96年
[4] 尹相志,Microsoft SQL Server2005資料採礦聖經,學貫行銷,民95年。
[5] 尹相志,SQL Server 2005 Data Mining資料採礦與Office2007資料採礦增益集,精誠資訊,民國96年。
[6] 尹相志,SQL Server 2005 OLAP線上即時分析,稅知文化,民96年
[7] 張美英,技專院校學生曠課行為之研究--以桃竹苗地區為例,國立臺灣師範大學公民教育與活動領導學研究所,碩士論文,民93年
[8] 徐正宇,AHP模式應用於招生策略與學生特質分析之研究,中原大學,碩士論文,民90年。
[9] 詹德麟,利用資料探勘技術於入學方式及學生背景對在校成績影響之研究,大葉大學事業經營研究所碩士在職專班,碩士論文,民97年
[10] 吳禮鈞,以資料探勘進行技職院校學生特質分析之研究,明新科技大學資訊管理研究所,碩士學位論文,民97 年。
[11] 彭莉櫻,運用料探勘技術於學習成效與招生策略之研究,玄奘大學資訊科學學系,碩士學位論文,民96 年。
[12] 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯,資料探勘Data mining,旗標出版股份有限公司,民95 年。
[13] 溫侑柯,應用資料探勘之關聯法則探討大學入學成績對在學成績的影響-以資管系為例,南華大學資訊管理研究所,碩士學位論文,民94 年。
[14] 劉紫瑩,應用資料探勘技術於學生特質與學業表現之研究,明新科技大學資訊管理研究所,碩士學位論文,民97年
[15] 楊琇媛,利用資料倉儲與資料探勘技術於招生策略與學生特質分析之研究,中原大學資訊管理學系,碩士學位論文,民92 年。
[16] 顏博文,應用資料探勘技術分析學生選課特性與學業表現,中原大學資訊管理學系,碩士學位論文,民92 年。
[17] 嚴玉華,我國技職校院研究所招生策略之研究,國立台北師範學院國民教育研究所,碩士論文,民90年
[18] 教育部統計處,取自:http://140.111.34.54/statistics/content.aspx?site_content_sn=8956
[19] B.A. Devlin and P.T. Murphy, “An Architecture for a Business and Information System”, IBM Systems Journal, Volume 27, No. 1, 1988.
[20] Berry, M.J.A. and Linoff, G., Data Mining Technique for Marketing, Sale, andCustomer Support, Wiley Computer, 1997.
[21] Curt, H., The Devile’s in The Detail: Techniques, Tool, and Applications for Data mining and Knowlegde Discovery-Part 1, Intelligent Software Strategies, Vol. 6,No. 9,1995, pp.1-15..
[22] E. F. Codd, “Providing OLAP (on-line analytical processing) to user-analysts: An IT-mandate”, Technical repor, E.F. Codd and Associates, 1993.
[23] Frawley, W. J. G.. Paitetsky-Shapiro, and C. J. Matheus, “Knowledge Discovery in Database :An Overview”, Knowledge Discovery in Database, AAAI Press/The MIT Press, Menlo Park, CA, 1991
[24] Jiawei Han, Micheline Kamber, “Data mining:Concepts and Techniques”, ch.2, 2001.
[25] J.B. MacQueen, “Some Methods for Classification and Analysis of Multivariate Observations”, In Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, CA, p. 281-297, 1967.
W.H Inmon, “Building the Data Warehouse”, John Wiley & Sons, Inc, 1996.

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊
 
系統版面圖檔 系統版面圖檔