跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.106) 您好!臺灣時間:2026/04/03 19:47
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:吳雅卉
研究生(外文):WU, YA-HUIE
論文名稱:聊天機器人之研製-以PTT八卦板文章為知識庫
論文名稱(外文):Development of Retrieval-based Chatbot - Using PTT Gossip Articles as a Knowledge Base
指導教授:陳志達陳志達引用關係
指導教授(外文):CHEN, JYI-TA
口試委員:李昇暾盧文祥
口試委員(外文):Li, SHENG TUNWEN, HSIANG LU
口試日期:2019-07-10
學位類別:碩士
校院名稱:南臺科技大學
系所名稱:資訊管理系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2019
畢業學年度:107
語文別:中文
論文頁數:59
中文關鍵詞:聊天機器人自然語言處理JiebaWord2vecBM25
外文關鍵詞:ChatbotNatural Language ProcessingJiebaWord2vecBM25
相關次數:
  • 被引用被引用:13
  • 點閱點閱:1538
  • 評分評分:
  • 下載下載:315
  • 收藏至我的研究室書目清單書目收藏:2
近年來,人工智慧一直是熱門的議題,其中聊天機器人的應用最為廣泛,且因許多軟體公司推出聊天機器人開發平台,提供眾多強大的功能,例如:自然語言處理、語音辨識、關鍵字分析等技術,甚至有連接其他通訊平台的服務,讓開發者可以更輕鬆、快速客製化出聊天機器人。因此有不少企業開始使用聊天機器人來為消費者服務,如:點餐訂購、客服服務、金融服務等,、客服服務、金融服務等,不僅能節省人力與時間,還能根據以往的對話內容記錄、公開資訊及各種相關資料,快速進行分析,以了解使用者行為和行銷活動的成效。但這些聊天機器人大多數都是屬於Closed Domain的框架,使用者只能詢問特定領域的問題,且得到的回覆普遍都是制式性的回答,缺乏靈活性,使用者較不能感受到互動聊天的感覺。本研究使用python語言開發一個Open-domain的聊天機器人,首先運用爬蟲技術抓取PTT八卦板的文章,將這些資料進行自然語言處理,再將處理完畢後的語料用來訓練聊天機器人,並建構出模型,藉此匹配問答,當使用者輸入語句時,可從模型當中找尋出與其相關之回答,並回覆給使用者。完成後的聊天機器人系統,將會發布在line平台上呈現,並達成問題檢索之有效性、快速性與趣味性之成果。
In recent years, artificial intelligence has been a hot topic, among which application of chat robots (chatbot) are the most adopted. Many software companies have launched chatbot development platforms, providing many powerful functions, such as natural language processing, speech recognition, keyword analysis and other functionalities. There are even services that connect to other communication platforms, making it easier and faster for developers to customize chatbots. Therefore, many companies have begun to use chatbots to serve consumers, such as ordering, customer service, financial services, etc. Not only saves manpower and time, but also quickly analyzes to understand the effectiveness of user behavior and marketing activities based on previous record of conversations, disclose information. However, most of these chatbots belong to the framework of Closed Domain. Users can only ask questions in specific areas, and the replies received are generally systematic answers and without flexibility and users can't feel the feeling of interactive chat. This study uses the python language to develop an Open-domain chatbot. First, we use the crawler technology to capture the PTT gossip articles, perform the natural language processing on those data, and then use the processed corpus to train the chatbot and construct it. The model is used to match the question and answer. When the user inputs query sentence, the relevant answer can be found from the model and replied to the user. The completed chatbot system will be published on the Line social media and will achieve the results of the validity, speed and fun of the problem retireval.
摘 要 I
ABSTRACT II
誌 謝 III
目 次 IV
表目錄 VIII
圖目錄 IIX
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機 2
1.3 研究目的 2
1.4 研究問題 4
1.5 論文架構 4
第二章 文獻探討 6
2.1 聊天機器人 6
2.2 自然語言處理 7
2.2.1 自然語言系統簡介 8
2.2.2 支援中文的自然語言處理系統 10
2.3 詞向量 12
2.3.1 詞向量表示法 12
2.3.2 連續詞袋模型 12
2.3.3 跳躍式模型 13
2.4 Okapi BM25 14
2.5 LINE Developers 16
第三章 研究方法 17
3.1 研究範圍與對象 17
3.1.1 研究範圍 17
3.1.2 研究對象 18
3.2 系統架構 18
3.3 系統規劃 20
3.4 自然語言處理 20
3.4.1 資料前置處理元件 21
3.4.2 斷詞處理 21
3.4.3 詞向量訓練元件 22
3.5 檢索式模型 23
3.6 LINE Developers 24
3.7  HEROKU 24
3.8 系統流程 25
3.9 預期成效 26
第四章 系統實作 27
4.1 系統開發工具與實作環境 27
4.2 建置聊天機器人資料庫 30
4.3 各模組元件開發 31
4.3.1 資料前置處理模組實作 31
4.3.2 斷詞元件實作 34
4.3.3 詞向量訓練 35
4.4 建構檢索式模型 36
4.5 系統呈現 37
第五章 系統分析與比較 42
第六章 結論與未來研究 45
6.1 結論 45
6.2 未來研究與發展 46
參考文獻 47
附錄A- LINE Developers操作流程 51
附錄B- Heroku佈署程式流程 54
附錄C-串接LINE流程 58

中文
[1]石敬弘,基於類神經之關聯詞向量表示於文本分類任務之研究,國立臺灣師範大學資訊工程研究所碩士論文,2017。
[2]批踢踢八卦板,https://www.ptt.cc/bbs/Gossiping/index.html。
[3]哈工大語言技術平台,https://www.ltp-cloud.com/。
[4]洪學儒,基於 Word2Vec 字詞向量模型之熱門主題偵測與命名方法,國立臺北科技大學資訊工程系研究所碩士學位論文,2017。
[5]家樂福-福媽,https://www.bnext.com.tw/article/50235/carrefour-line@
[6]國家教育研究院學術名詞字典,http://terms.naer.edu.tw/。
[7]陳思澄,使用詞向量表示與概念資訊於中文大詞彙連續語音辨識之語言模型調適,國立臺灣師範大學資訊工程研究所碩士論文,2015。
[8]彭昱傑,聊天機器人系統設計與實作,國立中正大學資訊工程研究所碩士論文,2017。
[9]結巴詞性對照表,https://gist.github.com/luw2007/6016931。
[10]微軟小冰,https://zh.wikipedia.org/wiki/%E5%B0%8F%E5%86%B0
[11]溫品竹、蔡易霖、蔡宗翰,基於 Word2Vec 詞向量的網路情緒文和流行音樂媒合方法之研究,The 2015 Conference on Computational Linguistics and Speech Processing, 167-179, 2015。
[12]劉秉鈞,人工智慧於模擬人類對話系統設計,逢甲大學自動控制工程學系研究所碩士論文,2016。
[13]鄭捷,自然語言處理:用人工智慧看懂中文,台灣:佳魁資訊,2018。
[14]賴森堂、黃彥綸,LINE 通訊軟體結合Chatbot 改善設備連線測試效率與品質,電腦稽核,38,25-36,2018。
[15]謝宗廷,基於Word2Vec之熱門主題偵測,國立臺北科技大學資訊工程研究所碩士論文,2016。
[16]魏彰村,運用爬蟲技術之主題導向即時通訊聊天機器人設計與實現以籃球領域諮詢結合LINE APP實作為例,國立中正大學通訊資訊數位學習碩士論文,2017。
[17]蘇柏勳,對話代理人中問句補全及問答句對之自動產生,國立成功大學資訊工程學系碩士論文,2012。
英文
[18]Domingos, Pedro (2015). The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World. New York: Basic Books.
[19]F. Esposito, A. Corazza, and F. Cutugno, "Topic Modelling with Word Embeddings,"Italian Conference on Computational Linguistics (CLiC-it), pp. 129-134, 2016.
[20]G.E. Hinton. Learning distributed representations of concepts. in Proceedings of the Eighth Annual Conference of the Cognitive Science Society, pages 1–12,Amherst 1986,1986. Lawrence Erlbaum,Hillsdale.
[21]HELLER, Bob, et al. (2005) Freudbot: An investigation of chatbot technology in distance education. In: Proceedings of the World Conference on Multimedia, Hypermedia and Telecommunications. p. 3913-3918.
[22]KERLY, Alice; HALL, Phil; BULL, Susan. (2017) Bringing chatbots into education: Towards natural language negotiation of open learner models. Knowledge-Based Systems,p177-185。
[23]L. Caviglione and W. Mazurczyk , “Understanding Information Hiding in iOS,”Computer,pp.62 – 65,2015.
[24]LINE Developers, https://developers.line.biz/en/.
[25]Mikolov, T., et al. "Distributed Representations of Words and Phrases and their Compositionality." CoRR abs/1310.4546,2013.
[26]Pamela McCorduck writes of "the rough shattering of AI in subfields—vision, natural language, decision theory, genetic algorithms, robotics ... and these with own sub-subfield—that would hardly have anything to say to each other. pp 424",2004
[27]Reshmi, S.Balakrishnan, Kannan. Implementation of an inquisitive chatbot for database supported knowledge bases.Sa¯dhana¯ , Vol. 41,1173–1178,2016.
[28]Russell, S. J., & Norvig, P. (2010). Artificial intelligence: a modern approach. USA; PearsonEducation,Inc.
[29]S. E. Robertson, S. Walker, S. Jones, M. Hancock-Beaulieu and M. Gatford,“Okapi at TREC-3”, In Proceedings of the Third Text Retrieval Conference(TREC-3), NIST, 1995.
[30]S.Robertson, The Probabilistic Relevance Framework: BM25 and Beyond, vol. 3, no.4. 2010.
[31]SHAWAR, Bayan Abu; ATWELL, Eric. (2003) Using dialogue corpora to train a chatbot. In: Proceedings of the Corpus Linguistics conference. p. 681-690.
[32]Stanford Parser, http://nlp.stanford.edu:8080/parser/index.jsp
[33]T. Mikolov, K. Chen, G. Corrado, and J. Dean. Efficient estimation of word epresentations in vector space. In International Conference on Learning Representations,2013.
[34]TURING, Alan M. Computing machinery and intelligence. In: Parsing the Turing Test. Springer, Dordrecht, 2009. p. 23-65.
[35]Wallace, Richard. "The elements of AIML style." Alice AI Foundation (2003).
[36]Weizenbaum J. ELIZA—a computer program for the study of natural language communication between man and machine. Communications of the ACM, page36-45,1966.
[37]Zadrozny, W., Budzikowska, M., Chai, J., Kambhatla, N., Levesque, S., & Nicolov, N. "Natural language dialogue for personalized interaction." Communications of the ACM, 2000, vol. 43, no. 8, pp. 116-120.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊