研究生(外文):Ya Min Feng
論文名稱(外文):Classifying News Evaluation via Text Mining-A Case Study Based on Net Financial News
外文關鍵詞:Data MiningSupport Vector MachineBackpropagation Neural Network
With prevalence of Internet, people can easily and quickly retrieve the information what they want from Internet. In Information explosion, users receive more information what they don’t want from internet. It is important how to manager information from Internet. Nearly several yeas, there is more and more the techniques of data mining used on the internet.
This research uses the technique of text mining usage in the finance and economics news of the YAHOO network. The news document is cut into a set of individual word through the word segment of Academia Sinica. After that, calculate the IDF and information gain of each word and choose several keyword from the set of news document by information gain. Those words will become the variable of the mining’s technique importation. This research uses SVM and BNN two kinds of mining technique and compares two kinds of accuracy for categorizing. SVM have bast precision rate and faster than BNN.
In the experiment, this research induces into the news category that has positive meaning or negative meaning through to the classification of the document and expecting can increase the finance and economics news sorting and read efficiency.
第一章 緒論 1
第一節 研究動機 1
第二節 研究目的 2
第三節 研究流程 2
第四節 論文架構 3
第二章 文獻探討 5
第一節 資料探勘 5
第二節 文件探勘 7
第三節 中文斷詞 8
第四節 詞彙權重計算 9
第五節 資訊獲利率 10
第六節 類神經網路 11
第七節 支持向量機 13
第三章 實驗流程與方法 16
第一節 實驗設計 16
第二節 實驗流程 16
第三節 研究環境 17
第四節 資料來源與前處理 18
第五節 人工辨別資料 19
第六節 挑選關鍵詞 20
第七節 資料轉換 22
第八節 實驗進行方式與評估 22
第四章 實驗結果 24
第一節 樣本資料描述 24
第二節 演算法參數測試 24
第三節 各類別樣本數量實驗結果 27
第四節 詞彙與字元的實驗結果 31
第五節 分類錯誤分析 34
第六節 其他嘗試性實驗 38
第五章 結論與未來展望 40
第一節 結論 40
第二節 研究範圍與限制 41
第三節 後續研究方向 41
參考文獻 43
