跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2024/12/03 13:42
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:邱孟俞
研究生(外文):Meng-Yu Chiu
論文名稱:擷取重要字詞擴充情緒辭庫改善情緒分析之研究-以Dcard工作版為例
論文名稱(外文):An Extended Sentiment Dictionary Approach with TF-IDF to Enhance Sentiment Analysis Taking the Dcard Job forum as an example
指導教授:呂永和
指導教授(外文):Yungho Leu
口試委員:楊維寧陳雲岫
口試委員(外文):Wei-Ning YangYun-Shiow Chen
口試日期:2017-07-29
學位類別:碩士
校院名稱:國立臺灣科技大學
系所名稱:資訊管理系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2017
畢業學年度:105
語文別:中文
論文頁數:28
中文關鍵詞:情緒分析情緒辭典TF-IDF文字探勘
外文關鍵詞:Sentiment AnalysisSentiment DictionaryTF-IDFText Mining
相關次數:
  • 被引用被引用:3
  • 點閱點閱:731
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在科技日新月異的進步下,社群平台已經成為許多人每天使用以及瀏覽的平台之一,而他們也會在社群平台上分享自己對於事物的看法並與人作意見的交流,雖然現今社會提倡言論自由,但是在暢所欲言的同時,卻往往忽略了網路文章帶來的影響力。當使用者在社群平台中閱覽文章的時候,他們會對自己喜歡的內容產生認同感,進而改變自己對於文中評論之事物的看法。本研究在幫助使用者初步判斷文章中帶有的情緒程度,讓使用者在閱覽文章之前,根據程式判斷結果斟酌認同程度。本研究中首先利用情緒辭典對Dcard工作版中的283篇熱門文章進行正負面詞彙分析,並利用TF-IDF方式取出已分類好文章中的關鍵字,並透過情緒分數的計算方式擴充至情緒字典中,最後再利用貝氏分類器為全新的文章進行分類。實驗結果發現,準確率(Accuracy)達70%,查全率(Recall rate)達88%,能夠正確地判斷一篇文章是屬於正面情緒或負面情緒。
With the advance of social networks, posting and reading articles on a website have become our daily routine. People can easily express their opinions with others through a social network. Although "freedom of speech" is guaranteed in a democratic country, one cannot neglect the effect of a web article. In this research, we proposed a method to perform sentimental analysis on web-based articles. Our research first used a well-known Chinese sentiment dictionary to classify 283 most popular articles; then, we used the TF-IDF scheme to select important keywords from these articles; subsequently, we expanded the Chinese sentiment dictionary with the keywords found by using the TF-IDF scheme. Based on the expanded Chinese sentiment dictionary, we used the Naive Bayes classifier to classify 30 new articles and calculated the accuracy of the classification. The experimental results showed that the accuracy is about 70 percent and the recall rate is about 88 percent.
摘要 I
ABSTRACT II
誌謝 III
目錄 IV
圖目錄 VI
表目錄 VII
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目的 1
1.3 論文架構 4
第二章 文獻探討 6
2.1 台灣社群平台使用狀況與現象 6
2.1.1 社群平台使用趨勢 6
2.1.2 社群中的從眾現象 7
2.2 斷字斷詞技術 7
2.3 情緒分析 8
2.3.1 情緒辭庫 8
2.4 量表信度測量 9
2.4.1 Kappa統計量 9
2.5 分類工具 9
2.5.1 貝氏分類器 9
第三章 研究方法 12
3.1 研究架構 12
3.2 研究對象與工具 13
3.2.1 研究對象 13
3.2.2 研究工具與環境 13
3.3 研究方法與流程 14
3.3.1 步驟1:抓取社群平台資料 14
3.3.2 步驟2:定義特徵值 15
3.3.3 步驟3:分類文章情緒 15
3.3.4 步驟4:斷字斷詞 17
3.3.4 步驟5:擴充情緒辭庫 18
3.3.5 步驟6:評估模型 20
第四章 研究結果與討論 22
4.1 情緒分數權重調整 22
4.2 評估結果 22
4.3 誤判情形探討 23
第五章 結論與建議 26
5.1 結論 26
5.2 未來發展 26
參考文獻 27
[1] 曾靉(2017)5年打造每月800萬不重複訪客,社群新星Dcard如何崛起?取自https://www.bnext.com.tw/article/44423/how-social-media-dcard-reaches-millions-users
[2] 何文君(2016)小三美日怒告Dcard!不滿遭匿名控販售「假貨」。取自http://news.tvbs.com.tw/life/684381
[3] 資策會FIND/經濟部技術處「資策會FIND(2016)/ 服務系統體系驅動新興事業研發計畫(2/4)」
[4] 從眾效應 - 維基百科,自由的百科全書. 取自https://zh.wikipedia.org/wiki/%E5%BE%9E%E7%9C%BE%E6%95%88%E6%87%89
[5] 創市際市場研究顧問公司雙週刊(第67期):7-8。
[6] 詹壬菡、方彩欣(2012)論網路虛擬社群中的從眾行為現象。設計研究學報,5,153-167。
[7] Hanson, W. A., & Putler, D. S. (1996). Hits and misses: Herd behavior and online product popularity, Marketing Letters, Vol 7, 297-305
[8] Asch, S. E. (1951). Effect of group pressure upon the modification and distortion of judgments. Journal of Marketing Research, 16, 394-400.
[9] 郭俊桔、張育蓉(2013)使用情緒分析於圖書館使用者滿意度評估之研究。圖書資訊學研究,7:2 (June 2013):153-197。
[10] Ku, L. W. & Chen, H. H. (2007). Mining Opinions from the Web: Beyond Relevance
Retrieval. Journal of American Society for Information Science and Technology,
58, 1838-1850.
[11] 吳蕙欣(2011)。結合多辭典與常識網路的情緒分析系統。台灣大學資訊工程學系碩士論文。
[12] [Machine Learning] Bayes貝氏分類演算法 取自 http://enginebai.logdown.com/posts/241677/bayes-classification
[13] 吳姮憓、羅偉峰(2014)「按讚、留言或分享」-探究影響臉書訊息反應行為意圖之前置因素。行銷評論,Vol.11,2,107-132
[14] 錢鉦津(2016)淺談監督式機器學習的測試評估方法-如何確保大數據分析的品質。叡揚e論壇,第82期,11-13。
[15] Landis, J. & Koch, G. G. (1977). The Measurement of Observer Agreement for
Categorical Data. Biometrics, 33, 159-174
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top