# 臺灣博碩士論文加值系統

(3.236.84.188) 您好！臺灣時間：2021/08/03 16:01

:::

### 詳目顯示

:

• 被引用:1
• 點閱:122
• 評分:
• 下載:0
• 書目收藏:0
 一般關聯式分類法(Associative Classification, AC)在規則排序(Ranking)[1][2]上，作法是先依照信賴值由高至低排序，接著依支援值由高至低排序，再依規則由短至長排序，短規則因為通用性較高，通常為了讓更多文件可以分類，因此短規則在排序上優於長規則。本論文核心即在針對規則排列問題，除了採用Lazy法[3]所提出的排序法則為一般排序原則外，再加上本論文提出之類別優先度來探討其對分類效能的影響。再結合TFIDF[4]及貝氏分類器[5]先做第一次分類，計算其準確率及F1值，利用這些數據設定單一門檻值、為了避免不同類別間的落差，針對各類別設定多重門檻值，並利用靜態不變及動態修正門檻值兩種方式來引用規則並執行分類。
 General relational classification (Associative Classification, AC) in the rules of order (Ranking) [1] [2], the approach is to rely on the value of pupils in accordance with the order, and then sorted according to support the value of pupils, according to the rules Sorting by short to long and short rules because of the higher common, usually in order to allow more files can be categorized, so in short order on the rules of the rules is better than long. In this paper, that is the core of the problem in order for the rules, in addition to the use of Lazy method [3] by the law of the sort order for the general principles, together with the categories proposed in this paper to discuss the priority of its impact on the classification performance. Combined with the TFIDF [4] and Bayesian classifier [5] first classified the first time to calculate their accuracy rate and the F1 value, use the data to set a single threshold value, in order to avoid differences between different categories for each of the categories to set multiple threshold value, and use the same static and dynamic threshold amended to refer to two ways and the implementation of classification rules.
 目錄第一章 序論 11.1 前言 11.2 研究動機與目的 21.3 論文架構 4第二章 相關文獻探討 52.1　關聯式分類 (Associative Classification) 52.2　預處理(Pre-processing) 72.3　規則產生 (Rule Generation) 72.4　規則排序 (Ranking) 102.5　刪除規則 (Pruning) 112.6　關聯式分類器 (Association Rule Classifier) 132.7 多重分類器 152.8　TFIDF特徵選取 172.9　Naive-Bayes貝氏分類法 182.10　評量值 20第三章 研究方法 223.1 類別優先度(Class Priority) 223.2 門檻值設定 243.3 靜態門檻值 253.4 動態門檻值 263.5 執行策略 28第四章 實驗結果 304.1　資料來源 304.2　實驗步驟 324.3　實驗結果 334.3.1 Precision-based分類結果 334.3.2 F1-based分類結果 354.4 實驗結果分析 38第五章 結論與未來展望 395.1 結論 395.2 未來展望 40參考文獻 41附錄 英文論文 43圖目錄圖2-1　關聯式分類器分類流程示意圖 6圖2-2　CBA 排序法 10圖2-3　Lazy 排序法 10圖2-4　database coverage演算法 11圖2-5　Lazy 演算法 12圖3-1　靜態門檻值流程圖 25圖3-2　動態門檻值流程圖 26表目錄表2-1　關聯式規則搜索與關聯式分類差異表 5表2-2　Lazy分類器實驗結果 15表2-3　利用準確率為靜態及動態門檻值之分類準確率比較 16表2-4　文件數量分佈表 20表4-1　由各系所選取出的文章數 30表4-2　文件描述的格式 31表4-3　文件經過斷詞以後的結果 32表4-4　依準確率設定單一門檻值 33表4-5　依準確率設定多重門檻值 34表4-6　利用準確率為靜態及動態門檻值之分類準確率比較 35表4-7　利用準確率為靜態及動態門檻值之分類文件正確數比較 35表4-8　依F1設定單一門檻值 35表4-9　依F1設定多重門檻值 36表4-10　利用F1為靜態及動態門檻值之分類準確率比較 37表4-11　利用F1為靜態及動態門檻值之分類文件正確數比較 37表4-12　最佳實驗結果 38
 [1] B. Liu, W. Hsu, and Y. Ma, “Integrating Classification and AssociationRule Mining,＂ Knowledge Discovery and Data Mining, 1998, pp. 86, 80.[2] F. THABTAH, “A review of associative classification mining,＂ Knowl.Eng. Rev., vol. 22, 2007, pp. 37-65.[3] P.G. Elena Baralis, “A Lazy Approach to Pruning ClassificationRules,＂ Dec. 2002.[4] G. Salton and C. Buckley, Term Weighting Approaches in Automatic TextRetrieval, Cornell University, 1987.[5] T.M. Mitchell, Machine Learning, McGraw-HillScience/Engineering/Math, 1997.[6] Yongwook Yoon and G. Lee, “Text Categorization Based on BoostingAssociation Rules,＂ Semantic Computing, 2008 IEEE InternationalConference on, 2008, pp. 136-143.[7] M.F. Porter, “An algorithm for suffix stripping,＂ Readings ininformation retrieval, Morgan Kaufmann Publishers Inc., 1997, pp.313-316.[8] R. Agrawal and R. Srikant, “Fast Algorithms for Mining AssociationRules,＂ Proc. 20th Int. Conf. Very Large Data Bases, VLDB, J.B. Bocca,M. Jarke, and C. Zaniolo, eds., Morgan Kaufmann, 1994, pp. 487–499.[9] J.R. Quinlan and R.M. Cameron-jones, “FOIL: A Midterm Report,＂ INPROCEEDINGS OF THE EUROPEAN CONFERENCE ON MACHINE LEARNING, vol. 667,1993, pp. 3--20.[10] W. Li, J. Han, and J. Pei, “CMAR: accurate and efficientclassification based on multiple class-association rules,＂ DataMining, 2001. ICDM 2001, Proceedings IEEE International Conferenceon, 2001, pp. 376, 369.[11] Y.M. Chen, “Using Association Rule to Improve The Accuracy of TextCategorization - The Combination with other Classifiers,＂ Masterthesis of Tamkang University, Jun. 2009, pp. 1-57.[12] M. Hung, “Improve document classify accuracy by associationrule-static threshold and dynamic threshold research ,＂ Masterthesis of Tamkang University, Jun. 2009, pp. 1-40.[13] Y. Yang and X. Liu, “A re-examination of text categorizationmethods,＂ Proceedings of the 22nd annual international ACM SIGIRconference on Research and development in information retrieval,Berkeley, California, United States: ACM, 1999, pp. 42-49.[14] T. Joachims, “A Probabilistic Analysis of the Rocchio Algorithm withTFIDF for Text Categorization,＂ Proceedings of the FourteenthInternational Conference on Machine Learning, Morgan KaufmannPublishers Inc., 1997, pp. 143-151.[15] P. Bickel and E. Levina, “Some theory for Fisher''s lineardiscriminant function, `naive Bayes'', and some alternatives whenthere are many more variables than observations,＂ Bernoulli, vol.10, 2004, pp. 1010, 989.[16] Tseng, Yuen-Hsien, “Effectiveness Issues in Automatic TextCategorization,＂ Bulletin of the Library Association of China, vol.68, Jun. 2002, pp. 62-83.[17] 國家圖書館, “ 全國博碩士論文資訊網,http://etds.ncl.edu.tw/theabs/index.html.＂[18] 中央研究院, “中文斷詞系統, http://ckipsvr.iis.sinica.edu.tw/.＂
 推文當script無法執行時可按︰推文 網路書籤當script無法執行時可按︰網路書籤 推薦當script無法執行時可按︰推薦 評分當script無法執行時可按︰評分 引用網址當script無法執行時可按︰引用網址 轉寄當script無法執行時可按︰轉寄

 1 以模糊自動機解決排名問題 2 多層次規則優先度排序對關聯式分類效能影響 3 應用多層次架構之類別優先度與多重分類器改善文件分類準確率 4 利用多層次類別優先度之規則排序以改善關聯式分類效能

 無相關期刊

 1 利用關聯式法則改善文件分類準確度-結合其他分類器 2 概念集群法於自動化文件分類之研究 3 以模糊理論與高頻項目集為基礎之文件分群研究 4 利用關聯式法則改善文件分類準確度-靜態與動態門檻值問題之探討 5 資料探勘應用於文件分類技術之研究-以網路新聞分類為例- 6 網際網路上大型虛擬環境之虛擬多址傳輸路由器的設計 7 以超文書為基礎的多媒體應用發展環境 8 二維度網頁文件分類模式 9 利用自動化關鍵字選取與文件分群技術優化醫學文章之資訊擷取 10 利用混合式中文特徵選取法於知識文件分類 11 應用詞頻以改良多元貝氏定理於文件分類之研究 12 結合本體論與封閉高頻項目集之階層式文件分群法 13 基於整合特徵詞擷取方法的文件分類系統 14 從不確定性資料中探勘最大頻繁項目集 15 Google文字關聯在多領域文件分類上的應用

 簡易查詢 | 進階查詢 | 熱門排行 | 我的研究室