研究生(外文):Ruei-Chuan Chien
論文名稱(外文):The Mechanisms of Applying K-Nearest Neighbor Algorithm for Classifying Self-¬Explanations
外文關鍵詞:Self-explainingTF-IDFK-Nearest Neighbor
Self-explaining is a self-constructive learning activity, which engages students in clarifying and explaining the content and self-monitoring their understanding of the content. Students may generate many kinds of self-explanations, such as re-reading, paraphrase, bridging inference, prior knowledge inference, logic inference, self-monitoring. In general, student explanations need to be classified by human experts, and the classification is time-consuming and labor-intensive. This study applies data mining techniques to automatically classify student explanations. This study adopts vector space model to represent student explanations and applies K-nearest neighbor mechanism to classify student explanations. This study investigates and compares five K-nearest neighbor classification mechanisms: traditional K-Nearest Neighbor, adaptive k-Nearest Neighbor, adaptive k-Nearest Neighbor which includes content for self-explaining, adaptive k-Nearest Neighbor which includes content for self-explaining and excludes common words, adaptive k-Nearest Neighbor with multiple classification. The evaluation results show that adaptive k-Nearest Neighbor with multiple classification has best classification correctness. The correctness of classifying self-monitoring is about 90% and total correctness of classification is about 70%.
摘要 II
表目錄 V
圖目錄 VI
第一章 緒論 1
1.1 研究背景 1
1.2 研究目的 2
第二章 文獻探討 3
2.1 自我解釋 3
2.2 資料探勘 6
2.2.1 向量空間模型 8
2.2.2 特徵擷取 9
2.2.3 K最近鄰近法 9
第三章 自我解釋分類機制 11
3.1 分類機制研發流程 11
3.2 自動分類機制流程 12
3.3 分詞處理 14
3.4 特徵擷取 14
3.5 K個最近鄰近法 17
3.5.1 傳統K最鄰近法 18
3.5.2 適應性K最鄰近法 20
3.5.3 納入教材內容之適應性K最鄰近法 21
3.5.4 納入教材內容並去除通用字詞之適應性K最鄰近法 22
3.5.5 多重分類之適應性K最鄰近法 23
第四章 評估 25
4.1 評估方法 25
4.2 評估資料 26
4.3 評估結果 29
4.3.1 基於單一人員分類自我解釋資料之最鄰近法分類結果 29
4.3.2 基於兩人分類一致自我解釋資料之最鄰近法分類結果 34
4.3.3 基於兩人分類不一致自我解釋資料之最鄰近法分類結果 40
第五章 結論與建議 44
5.1 結論 44
5.2 未來研究建議 46
參考文獻 47

表2-1、ISTART分類與人工分類的比對(引用MCNAMARA, 2004) 5
表3-1 自我解釋分詞範例 14
表3-2 人工選定自我解釋訓練資料集範例 19
表 3-3 通用字詞範例 23
表4-1 系統評估之參數 26
表 4-2 三位分類人員於自我解釋的分類數量 27
表 4-3 三位分類人員進行分類之範例 28
表 4-4 單一人員分類自我解釋資料在傳統K最鄰近法分類的準確性 31
表 4-5 單一人員分類自我解釋資料在傳統與不同的適應性K最鄰近法的F1-MEASURE準確性 32
表 4-6 單一人員分類自我解釋資料在不同機制下的整體正確率 34
表 4-7分類人員B *分類人員C觀察值摘要 35
表 4-8 分類人員B *分類人員C 分類個數交叉表 36
表 4-9 對稱性量數 36
表4-10兩人分類一致性在不同的適應性與多重分類K最鄰近法的F1-MEASURE正確率 37
表4-11 兩人分類一致性自我解釋資料在不同分類機制下之整體正確率 39
表 4-12多重分類時分類錯誤之詳細情形 40
表4-13分類人員B *分類人員C分類不一致之個數 41
表4-14 分類人員B與分類人員C分類不一致的範例 41
表 4-15兩人分類不一致之自我解釋類別個數 42
表 4-16 兩人分類不一致之自我解釋資料使用多重分類之正確率評估 43

圖 2-1 知識發掘流程 7
圖2-2 K最近鄰近法示意圖 10
圖3-1 自我解釋分類機制研發流程圖 12
圖3-2 自我解釋自動分類流程圖 13
圖3-4 全部選取訓練與測試資料集概念 20
圖4-1單一人員分類自我解釋資料在傳統K最鄰近法F1-MEASURE正確率分佈圖 31
圖 4-2 單一人員分類自我解釋資料在傳統與不同的適應性K最鄰近法的F1-MEASURE正確率分佈圖 33
圖4-3兩人分類一致性在不同分類機制下的F1-MEASURE正確率分佈圖 38
