摘要 II Abstract III 誌謝 IV 目錄 V 表目錄 VII 圖目錄 VIII 第一章 緒論 1 1.1 研究背景與動機 1 1.2 研究目的 3 1.3 研究步驟與流程 3 第二章 文獻回顧與探討 5 2.1 文件分類 5 2.1.1 監督式與非監督式學習 5 2.1.2 文件分類流程 6 2.1.2 文件呈現與預處理 7 2.1.3 特徵選取 7 2.1.4 向量空間模型 9 2.1.5 詞頻-逆向文件頻率 9 2.1.6 文件分類技術 12 2.2 模糊集合理論 15 2.2.1 模糊集合 16 2.2.2 模糊邏輯 16 2.2.2 模糊α截集 16 2.2.3 基本模糊運算元 18 2.2.4 模糊集合相似度 18 2.3 正規概念分析 18 2.3.1 正規情境 19 2.3.2 正規概念 19 2.3.3 概念網路 20 2.3.4模糊正規概念分析 22 第三章 研究方法 23 3.1 研究流程 23 3.2 建構文件向量 24 3.2.1 文件預處理 24 3.2.2 特徵選取 24 3.2.3 計算特徵詞權重 25 3.3 建構概念網路 25 3.4 文件概念化 27 3.4.1 計算概念隸屬度 27 3.4.2 學習與分類 29 第四章 實驗與分析 33 4.1 實驗方法 33 4.1.1 資料集介紹 33 4.1.2 分類效能評估指標 34 4.2 實驗結果 35 4.2.1 敏感度分析 39 4.2.2 實驗結果比較 42 4.2.3 統計檢定 45 第五章 結論與未來展望 47 5.1 結論 47 5.2 應用價值 47 5.3 未來展望 48 參考文獻 49 附錄一:Reuters 21578下未概念化SVM與本研究方法之30次實驗結果 52 附錄二:20 Newsgroups下未概念化SVM與本研究方法之30次實驗結果 53
|