跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.172) 您好!臺灣時間:2025/09/10 06:32
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:林名彥
研究生(外文):Lin, Ming-Yen
論文名稱:應用文字探勘技術於客訴資料之研究-以台大PPT論壇為例
論文名稱(外文):Applying Text Mining to Customer Complaints on the NTU PPT Forum
指導教授:馬芳資馬芳資引用關係
指導教授(外文):Ma, Fang-Tz
口試委員:郭展盛胡鳳義馬芳資
口試委員(外文):Kuo, Chan-ShengHu, Fen-GiMa, Fang-Tz
口試日期:2015-07-15
學位類別:碩士
校院名稱:龍華科技大學
系所名稱:資訊管理系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
語文別:中文
論文頁數:59
中文關鍵詞:文字探勘客訴LDA Gibbs
外文關鍵詞:Text MiningCustomer ComplaintLDA
相關次數:
  • 被引用被引用:26
  • 點閱點閱:5654
  • 評分評分:
  • 下載下載:710
  • 收藏至我的研究室書目清單書目收藏:2
網際網路的盛行下許多消費者會透過網路論壇來發表意見,尤其是網購商品的抱怨;目前企業對於顧客抱怨(又稱客訴)的處理,大多是以客戶服務中心人員來取得顧客抱怨資訊而進行處理,對於網路論壇上的抱怨資訊常常是無法來處理。因此,本研究搜集網路論壇的客訴文章進行文字探勘,以尋找抱怨文中的關鍵字詞,並瞭解網友們經常抱怨的主題和關聯的字詞。
本研究使用R語言撰寫程式來自動抓取台大PTT e-shopping論壇上的文章,每一篇文章存成一個文字檔以形成文檔庫;接著以人工方式挑選出868篇抱怨文,利用文字探勘套件將文檔庫內文章進行中文斷詞;出現次數40個以上的字詞來繪製關鍵字雲;然後利用LDA Gibbs方法計算每一個關鍵字的TF-IDF,並且設定10個主題來找出關鍵字詞的關聯性。
研究結果顯示這些抱怨文經由中文斷詞後有4004個關鍵字,出現次數達40次的有278個重要關鍵字;利用LDA Gibbs模式從278個字中找出10個主題,分別是訂單、匯款、衣服、地址、朋友、貨運、顏色、公司、包裹、瑕疵等。從這10個主題中我們可以發現消費者在網購商品時常會發生的抱怨課題,而此可提供給電子商務業者在商品管理和服務上的參考,期能強化商品和服務以減少顧客的抱怨。

With the popularity of internet, many consumers comment in the forum, especially complaining about online shopping goods. Currently enterprises deal with customer complaints mostly focus on the complaints obtained by the staffs in the customer service center. They are often unable to handle the complains on the web forum. Thus, this research collected customer complaints in internet forum, and used text mining techniques to obtain the keywords in these complains and to understand the topics often complained by consumers and the association of terms.
This research wrote the R language programs to automatically crawl articles on the NTU PTT e-shopping forum. Each article was saved as a text file to set a document library. Then we manually picked out 868 complains, because some articles were not complains. We used text mining suite in R language to segment Chinese into words and get the most frequent terms of the complains. And we use the words which frequency is greater than 40 to draw a word cloud. Then we use the LDA Gibbs method to calculate the TF-IDF of these terms and set 10 themes to find the word association.
The results show that there are 4,004 keywords in complains after the Chinese tokenization. And there are 278 terms which frequency is greater than 40. Use LDA Gibbs method to find 10 topics from 278 words, which are orders, money transfer, clothes, address, friend, freight, color, company, package and defect. From these 10 topics, we can understand what consumers often complained about the online shopping. These results can be a reference for e-commerce vendors on merchandise management and service delivery to strengthen the goods and services to reduce customer complaints.

摘要 i
ABSTRACT ii
誌謝 iv
目錄 v
圖目錄 vii
表目錄 ix
第一章 緒論 1
1.1研究背景 1
1.2研究動機 2
1.3研究目的 3
1.4論文架構 3
第二章 文獻探討 4
2.1客訴 4
2.2客訴相關研究 6
2.3文字探勘 9
2.4 LDA 11
2.4.1 LDA的貝氏網路結構 12
2.4.2 Gibbs的抽樣方法 13
第三章 研究方法 15
3.1研究架構 15
3.2客訴資料收集方法 17
3.2.1 R語言 17
3.2.2 RCurl 18
3.3關鍵字詞搜尋 23
3.3.1資料提取 24
3.3.2中文斷詞 25
3.3.3關鍵字詞雲 29
3.4 LDA 30
3.4.1 詞頻-反轉文件頻率(TF-IDF) 30
3.4.2 LDA Gibbs模式 31
第四章 研究結果 37
4.1網路客訴分析流程 37
4.2客訴分析結果 38
4.2.1中文斷詞與關鍵詞字雲分析結果 38
4.2.2關鍵字數量與TF-IDF分析結果 40
4.2.3 LDA Gibbs模式分析結果 42
4.3分析結果討論 49
第五章 結論與未來研究 50
5.1結論 50
5.2未來研究 51
參考文獻 52
附錄 56

1.資策會(2013),2013年我國家庭寬頻現況與需求調查-個人,http://www.find.org.tw/find/home.aspx?page=many&id=386。
2.資策會(2013),2013年我國家庭寬頻現況與需求調查-家戶,http://www.find.org.tw/find/home.aspx?page=many&id=376。
3.PC HOME新聞(2014),全台奧客大調查-宅世代上網抱怨殺傷力最強,http://news.pchome.com.tw/magazine/print/po/cw/1195/124767360089295035001.htm
4.中村卯一郎(1992),抱怨處理讀本—化「抱怨」為企業「利潤」的法則,台北:遠流出版公司。
5.陳耀茂(1997),服務品質管理手冊,台北:遠流出版公司。
6.佐藤知恭(1988),顧客抱怨處理實務,台北:臺華工商圖書公司。
7.陳淑娟(1995),「零售賣場設計與現場消費行為關係之探索性研究--以台北市百貨公司為例」,碩士論文,元智工學院管理研究所,桃園。
8.蔣麗君(1999),「國內百貨公司顧客抱怨原因之實證研究」,碩士論文,靜宜大學企業管理究所,台中。
9.蔡厚灼(2003),「客訴文件探勘系統」,碩士論文,國立成功大學資訊管理研究所,台南。
10.陳俊達(2005),「影響客服中心電話服務量之因素探討-以資訊服務業為例」,碩士論文,國立中央大學資訊管理研究所,桃園。
11.陳瑞陽(2007),「智慧型代理人Web Services 整合平台―客訴下游問題回饋為例」,電子商務研究,第五卷,第三期,第361-386頁。
12.鄭麗珍、賴美惠(2011),「結合知識地圖之公部門陳訴文件自動化分案系統」,資訊管理學報,第十八卷,第4期,第1-20頁。
13.Wikipedia, LDA(2015), https://zh.wikipedia.org/wiki/%E9%9A%90%E5%90%AB%E7%8B%84%E5%88%A9%E5%85%8B%E9%9B%B7%E5%88%86%E5%B8%83.
14.蕭文峰(2014),「以LDA為基礎的英文論文重點擷取暨測驗系統」,資訊管理暨實務研討會,第20期,第812-826頁。
15.Wikipedia, Curl語言(2009), http://zh.wikipedia.org/wiki/Curl_(編程語言)。
16.晏文珍(2005),「利用資料探勘技術於文件分類之研究」,碩士論文,南台科技大學,資訊管理研究所,台南。
17.許文娜(2008),「從資訊系統導入的觀點分析客服系統之評選架構-以某壽險公司資訊系統專案為例」,碩士論文,銘傳大學管理研究所在職專班,台北。
18.劉凱銘(2010),「以分類時間為基礎之網際網路客訴分析」,碩士論文,輔仁大學資訊工程研究所萬維運算研究室,台北。
19.楊明青、何旻娟、呂萬吉(2003),「自助餐廳顧客抱怨原因之實證研究」,觀光休閒暨餐旅產業永續經言學術研討會,第3期。
20.蔡明達、陳怡謙(2007),「運動俱樂部客訴處理」,大學體育,第92期,第72-78頁。
21.顏財發(2012),「餐飲顧客投機客訴行為的決定因素」,運動休閒餐旅研究,第七卷,第2期,第29-44頁。
22.Jacoby, J. and Jaccard, J. J.(1981),"The Sources, Meaning & Validity of Consumer Complaining Behaviour : A Psychological Review,",Journal of Retailing, 57,4-24.
23.Singh, J.(1988),"Consumer Complaint Intentions & Behaviour : Definitional & Taxonomical Issues",Journal of Marketing, 52,93-107.
24.Fornell, C. and Wernerfelt, B.(1987),"Defensive Marketing Strategy by Consumer Complaint Management : A Theoretical Analysis" , Journal of Marketing Research, 24,337-346.
25.Kolter, P.(1997), Marketing Management : Analysis, Planning,Implementation, &
Control.
26.Renoux, Y. and F.C.Allvine,ed(1973),"Consumer Dissatisfaction and Public Policy, in Public Policy and Marketing." ,Chicago : American Marketing Association, 53-65.
27.Westbrook, R. A.(1981),"Sources of Consumer Satisfaction with Retail Outlets",Journal of Retailing, 57,4,68-85.
28.Bitner, M. J., Booms, B.G., and Tetreault, M. S. (1990), "The Service Encounter : Diagnosing Favorable and Unfavorable Incidents",Journal of Marketing, 54,71-84.
29.Kelley, S.W., Hoffman, K.D. and Davis, M.A.(1993),"A Typology of Retail Failures and Recoveries",Journal of Retailing, 69,4,429-452.
30.Hoffman, K.D., Kelley, S.W. and Rotalsky, H.M.(1995),"Tracking Service Failures and Employee Recovery Efforts",Journal of Services Marketing, 9,2,49-61.
31.Burnett, J. J., Amason, R.D. and Hunt, S.D.(1981),"Feminism :Implications For Department Store Strategy and Salesclerk Behavior",Journal of Retailing, 57,4,71-85.
32.D. Sullivan,(2001), Document Warehousing and Text Mining, Wiley Computer Publishing.
33.Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003), "Latent dirichlet allocation. " ,the Journal of machine research, 3, 993-1022.
34.Griffiths, T. L, & Steyvers, M.(2004), "Finding scientific topics, " Proceedings of the National academy of Sciences of the United States of America,101(Supp11),5228-5235.
35.Wang Y.(2008). "Distributed Gibbs Sampling of Latent Topic Models:The Gritty Details", https://cxwangyi.files.wordpress.com/2012/01/llt.pdf
36.Tang,L(2008)."Gibbs Sampling for LDA", http://leitang.net/presentation/LDA - Gibbs.pdf
37.Salton, Gerard and Buckley, C.(1988), "Term-weighting approaches in automatic text retrieval", Information Processing & Management, 24,5,513-523
38.Salton, Gerard.(1989) ,Automatic Text Processing,Addison-Wesley Publishing Company,.
39.Feldman, R. and Hirsh, H.(1997),"Exploiting Background Information in Knowledge Discovery from Text",Journal of Information System, 83-97.
40.Dörre, J., Gerstl, P. and Seiffert, R.(1999), "Text Mining: Finding Nuggets in Mountains of Textual Data,Proceedings of the 5’s ACM SIGKDD International Conference on Knowledge Discovery and Data Mining",398-401.
41.Singh et al., L.(1999),"An Algorithm for Constrained Association Rule Mining in Semi-structured Data",PAKDD-99,148-158.
42.Klemettinen, M., Mannila, H., and Verkamo, A. I.(1999),"Association Rule Selection in a Data Mining Environment",PKDD-99,372-377.
43.H. Chen,(2001), Knowledge Management Systems ─ A Text Mining Perspective.




QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top