跳到主要內容

臺灣博碩士論文加值系統

(44.200.86.95) 您好!臺灣時間:2024/05/22 14:19
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:林政彣
研究生(外文):Cheng-Wen Lin
論文名稱:利用錯誤文章建構自動作文評分系統
論文名稱(外文):Construction of Automated Essay Scoring from Wrong Data
指導教授:曹振海曹振海引用關係
指導教授(外文):Chen-Hai Tsao
學位類別:碩士
校院名稱:國立東華大學
系所名稱:應用數學系
學門:數學及統計學門
學類:數學學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
論文頁數:40
中文關鍵詞:自動作文評分系統機器學習文字探勘從錯誤中學習
外文關鍵詞:Automatic Essay ScoringMachine LearningText mining
相關次數:
  • 被引用被引用:1
  • 點閱點閱:564
  • 評分評分:
  • 下載下載:78
  • 收藏至我的研究室書目清單書目收藏:1
本研究探討利用統計機器學習的方法建構自動作文評分 (AES, Automatic Essay Scoring) 系統的一些議題,並討論 Perelman (2014) 對AES的批評並進行後續修 正。Perelman質疑 AES 沒有辦法判別語法正確、結構合理,但語句無意義的文章。 他的團隊建構一套軟體,BABEL generator,來欺騙機器獲得高分。我們針對他的質 疑進行修正,利用 BABEL generator 生成一定比例的文章,放入訓練資料中,並藉由 機器學習的「從資料中學習」的特性,使機器學習判斷 BABEL generator 生成的文章
並給予低分。另一方面我們也討論語法正確、結構合理且有實質意義,但文不對題的
文章,觀察這兩種類型的錯誤文章,對於建構自動文章評分的影響。

Perelman (2014) raises the concern and caution against Automatic Essay Scoring (AES). Perelman and his team create a system, BABEL, to prove the vulnerability of AES.BABELgeneratesmeaninglessessaysgettinghighscoresinsomeAEScurrently in use. Along this line, we investigate three questions:
1. Can a sound AES be fooled by BABEL generated essays?
2. Can an AES learn to distinguish/score these meaningless essays?
3. Can an AES learn to score irrelevant essays?
Using Random Forest and AdaBoost, we create a AES from Kaggle (2012) and BABEL essay data. Answers to the questions: our experiments suggest AES indeed can be fooled by BABEL essays. However, AES can be readily taught to give them low scores. Nonetheless, it is more difficult to teach AES about meaningfulness than relevance.

1. 序論
1.1 動機
1.2 章節安排
2. 文章資料
2.1 Kaggle 和 BABEL
2.2 文本矩陣
2.3 變數選擇
3. 機器學習
3.1 線性判別分析 LDA
3.2 支撐向量機 SVM
3.3 隨機森林 RF
3.4 自適應增強 AdaBoost
3.5 交叉驗證
4. 實驗
4.1 實驗環境與資料準備
4.2 機器學習方法參數設定
4.2.1 線性判別分析 LDA
4.2.2 支撐向量機 SVM
4.2.3 隨機森林 RF
4.2.4 自適應增強 AdaBoost
4.2.5 機器學習方法的選擇
4.3 實驗分析
4.3.1 BABEL 的文章分析
4.3.2 文不對題的文章分析
5. 結論

A 附錄
B 圖表
ATTALI, Y. and BURSTEIN, J. (2005). Automated Essay Scoring With E-rater v.2.0. Educational Testing Service

BREIMAN, L. (2001). Random Forests. Machine Learning. 43, 5–32.
DIETTERICH, T. (2000). Ensemble Methods in Machine Learning. Multiple Classifier Systems. 1–15.

FREUND, Y. and SCHAPIRE, R. E. (1995). A Decision-Theoretic Generalization of on-Line Learning and an Application to Boosting. Computational Learning Theory. 903, 23–37

HASTIE, T., TIBSHIRANI, R. and FRIEDMAN, J. (2009). The Elements of Statistical Learning. Second Edition. Springer.
Kaggle competitions. (2012). The Hewlett Foundation: Automated Essay Scoring. http://www.kaggle.com/c/asap-aes.

KOLOWICH, D. (2014). Writing Instructor, Skeptical of Automated Grading, Pits Machine vs. Machine. The Chronicle of Higher Education http://chronicle.com/article/Writing-Instructor-Skeptical/146211/

LIN, C.-J. (2001). A Library for Support Vector Machines. http://www.csie.ntu.edu.tw/∼cjlin/libsvm/index.html

PERELMAN, L. (2012). Construct Validity, Length, Score, And Time In Holistically Graded Writting Assessments: The Case Adainst Automated Essay Scoring (AES)

SOBEL, L., BECKMAN, M., JIANG, D. and PERELMAN, L. (2014). BABEL generator. http://babel-generator.herokuapp.com/

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 江中皓(2003),「我國運動觀光發展契機與潛力之評估-以高爾夫假期為例」。《國民體育季刊》,32,12-17。
2. 邱榮基、畢璐鑾(2005),「探討臺灣馬拉松運動之發展」。《大專體育》,80,54-61。
3. 宋威穎、雷文谷(2008),「從國內運動觀光之發展探討旅遊目的地行銷」。《大專體育》,94,104-112。
4. 宋威穎、張孝銘(2008),「國際企業舉辦運動觀光型活動行銷策略與管理模式分析-以美利達公司舉辦日月潭水陸單車行活動為例」。《休閒產業管理學刊》,1(1),11-25。
5. 朱景鵬、朱鎮明,(2013),「公共治理思潮下之我國地方治理」。《公共治理季刊》,1(1),84-98。
6. 朱鎮明,(2007),「觀察需要、滿足需要--顧客導向下的關係行銷」,《考銓季刊》。50,238-254。
7. 方信淵 (2005),「臺灣地區大專院校運動觀光課程發展研究」。《體育學報》,38(3),23-36。
8. 王育文(2009),「從策略管理觀點析論臺灣運動觀光發展應有的策略」。《管理實務與理論研究》,3(3),62-77。
9. 邱思慈、李承翰(2006),「運動觀光與區域發展」。《中華體育季刊》,20(2),46-54。
10. 林樹旺、蔡進發、張良漢、劉又慈(2007),「國際運動賽會對地方運動觀光發展影響之研究」。《休閒暨觀光產業研究》,2(1),27-49。
11. 林青輝、李詩賓、林國威(2012),「戶外休閒運動路線建構與觀光產業發展策略之研究」。《中原體育學報》,1,18-25。
12. 施美燕(2007),「拓展外國人士來台觀光之行銷策略研究」。《商業現代化學刊》,4(2),31-44。
13. 高俊雄(1995),「觀光旅遊地區經營開發之規劃與推動」。《觀光研究學報》,1(3), 29-43。
14. 高俊雄(2003),「運動觀光之規劃與發展」。《國民體育季刊》,32(3),7-11。
15. 高曉光、蔡蘇南(2009),「我國運動觀光現況之分析」。《嘉大體育健康休閒期刊》,8(2),214-219。