研究生(外文):Sheng-Fan Yang
論文名稱(外文):Opinion Mining of 3C Products Reviews on Web Forums Using an Integrated Rule-based Approach
指導教授(外文):Cheng-Jye Luh
外文關鍵詞:Opinion MiningSentiment AnalysisContext DependentCorrespondence AnalysisChinese Word Segmentation
隨著網際網路的發展,消費者會在網路的論壇或部落格分享他們購買與使用產品的經驗,或者在購買前請教他人問題。分析這些消費者產生的內容 (Customer Generated Media,CGM) 已逐漸成為行銷或品牌經理瞭解消費者傾向的重要管道。
本研究利用意見資訊的擷取與意見傾向的判斷技術,分析 「Mobile01」 3C 論壇裡網路使用者對筆記型電腦所表達的意見之傾向。本系統首先透過意見單元,以結構化的方式擷取 3C 論壇文章內容中對產品的意見,再以人工建置的 Heuristic Rules 以及使用關聯式法則訓練出來的 Context Dependent Rules 來判斷意見單元的語意傾向。實驗結果顯示,對語意傾向判斷的整體 F1 可達 89.55%。最後,本研究再以直條圖和對應分析的方式呈現產品的口碑狀況,表達使用者對產品在價格、功能等方面的正負向定位。
With proliferation of the Internet, consumers frequently share their opinions shopping or product using experience on forums and blogs. They also consult others on the Internet before making buying decisions. The analysis of consumer-generated content (Customer Generated Media, CGM) has become an important channel for the marketing professionals to understand consumer preferences.
This study employs an integrated rule-based method to conduct opinion mining of Notebook products from local web forum, Mobile3C.
We first create heuristic rules to determine semantic orientation of context independent opinion units. Then we generate association rules to resolve context dependent cases with the help of human annotators.
Experimental results indicate that the proposed rule-based system can determine semantic orientation with a Macro-F1 of 89.55%. We also provide visual user interface based on correspondence analysis results to show overall product reputation.
書名頁 i
論文口試委員審定書 ii
授權書 iii
中文摘要 iv
英文摘要 v
誌謝 vi
目錄 vii
表目錄 ix
圖目錄 x
第一章、緒論 1
1.1. 研究動機 1
1.2. 研究目的 2
1.3. 論文架構 2
第二章、文獻探討 3
2.1. 網路意見探勘 3
2.2. CGM 文章格式 4
2.3. 意見資訊的擷取 5
2.3.1 意見單元的定義 6
2.3.2 基於詞性的意見擷取方式 7
2.3.3 基於詞庫的意見擷取方式 8
2.3.4 中文斷詞 9
2.4. 意見傾向的判斷 11
2.4.1 Rule-based Method 12
2.4.2 WordNet Exploring Method 14
2.4.3 PMI Method 15
2.5. 半自動標註 (Semi-Automated Tagging) 16
2.6. 關聯式規則之探勘 16
2.7. 對應分析介紹 18
第三章、研究方法 20
3.1 系統運作流程 20
3.2 網頁擷取與網頁剖析 21
3.3 意見單元的擷取 22
3.3.1 CGM Segmentation 23
3.3.2 Generate OP Units 29
3.4 意見單元的語意傾向判斷 34
3.4.1 Context Independent 34
3.4.2 Context Dependent 36
3.5 Orientation Determination 41
第四章、實驗評估 42
4.1. 實驗資料集 42
4.2. 實驗評估指標 42
4.3. 系統傾向判斷實驗評估 44
4.3.1 5-fold Cross Validation 實驗 44
4.3.2 語意傾向誤判分析 47
4.4. 實驗結果畫面呈現 50
第五章、結論與未來展望 55
5.1. 結論 55
5.2. 未來展望 56
參考文獻 57
