跳到主要內容

臺灣博碩士論文加值系統

(98.82.120.188) 您好!臺灣時間:2024/09/13 04:39
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:簡瑞泉
研究生(外文):Ruei-Chuan Chien
論文名稱:最鄰近法應用之自我解釋分類機制
論文名稱(外文):The Mechanisms of Applying K-Nearest Neighbor Algorithm for Classifying Self-¬Explanations
指導教授:周志岳
口試委員:劉寶鈞劉晨鐘林繼任
口試日期:2012-6-27
學位類別:碩士
校院名稱:元智大學
系所名稱:生物與醫學資訊碩士學位學程
學門:生命科學學門
學類:生物訊息學類
論文種類:學術論文
畢業學年度:100
語文別:中文
論文頁數:54
中文關鍵詞:自我解釋TF-IDFK最鄰近法
外文關鍵詞:Self-explainingTF-IDFK-Nearest Neighbor
相關次數:
  • 被引用被引用:0
  • 點閱點閱:231
  • 評分評分:
  • 下載下載:7
  • 收藏至我的研究室書目清單書目收藏:0
自我解釋是一種自我建構式學習活動,該活動要求學生在研讀教材產生自我解釋來釐清和詮釋教材的內容,以及自我監測對教材的了解狀況。學生會產生許多類型的自我解釋,例如重述教材內容、意譯、連結性推論、領域先備知識推論、邏輯性推論、正面自我監測、負面自我監測等類型。通常要了解學生所產生自我解釋的類型,需要以人工的方式來分類自我解釋。本研究利用資訊探勘相關的技術提供五種不同的自我解釋分類機制用來自動分類學生的自我解釋,包括意譯、連結性推論、邏輯性推論、正面自我監測、負面自我監測五種類型。本研究先透過分詞技術分解學生的自我解釋,再使用TF-IDF權重計算方法找出學生自我解釋中的關鍵字並且給予特徵值,接著配合餘弦相似度建立向量空間模型和判斷自我解釋之間的相似性,最後藉由傳統K最鄰近法、適應性K最鄰近法、納入教材內容之適應性K最鄰近法、納入教材內容並去除通用字詞之適應性K最鄰近法、以及採多重分類之適應性K最鄰近等五種不同分類機制之來分類出自我解釋的種類。評估結果是以採多重分類之適應性K最鄰近法有最佳的分類準確性,在正面自我監測與負面自我監測的準確性可達到九成,而連接性推論、邏輯性推論與意譯的準確性也比其它類的分類機制較佳,整體的正確率則可達到七成。
Self-explaining is a self-constructive learning activity, which engages students in clarifying and explaining the content and self-monitoring their understanding of the content. Students may generate many kinds of self-explanations, such as re-reading, paraphrase, bridging inference, prior knowledge inference, logic inference, self-monitoring. In general, student explanations need to be classified by human experts, and the classification is time-consuming and labor-intensive. This study applies data mining techniques to automatically classify student explanations. This study adopts vector space model to represent student explanations and applies K-nearest neighbor mechanism to classify student explanations. This study investigates and compares five K-nearest neighbor classification mechanisms: traditional K-Nearest Neighbor, adaptive k-Nearest Neighbor, adaptive k-Nearest Neighbor which includes content for self-explaining, adaptive k-Nearest Neighbor which includes content for self-explaining and excludes common words, adaptive k-Nearest Neighbor with multiple classification. The evaluation results show that adaptive k-Nearest Neighbor with multiple classification has best classification correctness. The correctness of classifying self-monitoring is about 90% and total correctness of classification is about 70%.
目錄
摘要 II
表目錄 V
圖目錄 VI
第一章 緒論 1
1.1 研究背景 1
1.2 研究目的 2
第二章 文獻探討 3
2.1 自我解釋 3
2.2 資料探勘 6
2.2.1 向量空間模型 8
2.2.2 特徵擷取 9
2.2.3 K最近鄰近法 9
第三章 自我解釋分類機制 11
3.1 分類機制研發流程 11
3.2 自動分類機制流程 12
3.3 分詞處理 14
3.4 特徵擷取 14
3.5 K個最近鄰近法 17
3.5.1 傳統K最鄰近法 18
3.5.2 適應性K最鄰近法 20
3.5.3 納入教材內容之適應性K最鄰近法 21
3.5.4 納入教材內容並去除通用字詞之適應性K最鄰近法 22
3.5.5 多重分類之適應性K最鄰近法 23
第四章 評估 25
4.1 評估方法 25
4.2 評估資料 26
4.3 評估結果 29
4.3.1 基於單一人員分類自我解釋資料之最鄰近法分類結果 29
4.3.2 基於兩人分類一致自我解釋資料之最鄰近法分類結果 34
4.3.3 基於兩人分類不一致自我解釋資料之最鄰近法分類結果 40
第五章 結論與建議 44
5.1 結論 44
5.2 未來研究建議 46
參考文獻 47

表目錄
表2-1、ISTART分類與人工分類的比對(引用MCNAMARA, 2004) 5
表3-1 自我解釋分詞範例 14
表3-2 人工選定自我解釋訓練資料集範例 19
表 3-3 通用字詞範例 23
表4-1 系統評估之參數 26
表 4-2 三位分類人員於自我解釋的分類數量 27
表 4-3 三位分類人員進行分類之範例 28
表 4-4 單一人員分類自我解釋資料在傳統K最鄰近法分類的準確性 31
表 4-5 單一人員分類自我解釋資料在傳統與不同的適應性K最鄰近法的F1-MEASURE準確性 32
表 4-6 單一人員分類自我解釋資料在不同機制下的整體正確率 34
表 4-7分類人員B *分類人員C觀察值摘要 35
表 4-8 分類人員B *分類人員C 分類個數交叉表 36
表 4-9 對稱性量數 36
表4-10兩人分類一致性在不同的適應性與多重分類K最鄰近法的F1-MEASURE正確率 37
表4-11 兩人分類一致性自我解釋資料在不同分類機制下之整體正確率 39
表 4-12多重分類時分類錯誤之詳細情形 40
表4-13分類人員B *分類人員C分類不一致之個數 41
表4-14 分類人員B與分類人員C分類不一致的範例 41
表 4-15兩人分類不一致之自我解釋類別個數 42
表 4-16 兩人分類不一致之自我解釋資料使用多重分類之正確率評估 43


圖目錄
圖 2-1 知識發掘流程 7
圖2-2 K最近鄰近法示意圖 10
圖3-1 自我解釋分類機制研發流程圖 12
圖3-2 自我解釋自動分類流程圖 13
圖3-4 全部選取訓練與測試資料集概念 20
圖4-1單一人員分類自我解釋資料在傳統K最鄰近法F1-MEASURE正確率分佈圖 31
圖 4-2 單一人員分類自我解釋資料在傳統與不同的適應性K最鄰近法的F1-MEASURE正確率分佈圖 33
圖4-3兩人分類一致性在不同分類機制下的F1-MEASURE正確率分佈圖 38
參考文獻
Aleven, V., Pinkwart, N., Ashley, K., &; Lynch, C.(2006), “Supporting Self-explanation of Argument Transcripts: Specific v. Generic Prompts”, Proceedings of the Workshop on Intelligent Tutoring System for Ill-Defined Domains at the 8th International Conference on Intelligent Tutoring System,47-55.
Chi, M. T. H., Bassok, M., Lewis, M., Reimann, P., &; Glaser, R. (1989). Self-explanations: How students study and use examples in learning to solve problems. Cognitive Science, 13, 145-182.
Chi, M. T. H., de Leeuw, N., Chiu, M.H., &; LaVancher, C. (1994). Eliciting self-explanations improves understanding. Cognitive Science, 18, 439-477
Chi, M. T. H. (2000). Self-explaining expository texts: The dual processes of generating inferences and repairing mental models. In R. Glaser (Ed.), Advances in Instructional Psychology, Hillsdale, NJ: Lawrence Erlbaum Associates. 161-238.
Cover, T. M., Hart, P.E. (1967). Nearest neighbor pattern classification. IEEE Trans. Info. Theory 13, 57-67.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine, Vol. 17 No. 3, 37-54.
Hearst, M. (1999). Untangling text data mining. Proceedings of the 37th conference on Association for Computational Linguistics, 3-10.
Li, B., Lu, Q., &; Yu, Shiwen. (2004). An adaptive k-nearest neighbor text categorization strategy. ACM Transactions on Asian Language Information Processing (TALIP), 3(4), 215–226.
McNamara, D. S., Levinstein, I. B., &; Boonthum, C. (2004). iStart: Interactive strategy training for active reading and thinking. Behavior Research Methods, Instruments, and Computers, 36,222–233.
Pirolli, P., &; Recker, M.(1994).Learning strategies and transfer in the domain of programming. Cognition and Instruction, 12, 235-275.
Renkl, A. (1997). Learning from worked-out examples: A study on individual differences. Cognitive Science, 21, 1-29.
Salton, G. and Buckley, C. 1988 Term-weighting approaches in automatic text retrieval. Information Processing &; Management 24(5): 513–523.
Salton, G., Wong, A., and Yang, C. S. (1975) A Vector Space Model for Automatic Indexing, Communication of ACM, vol. 18, pp. 613-620.
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top