跳到主要內容

臺灣博碩士論文加值系統

(44.200.194.255) 您好!臺灣時間:2024/07/15 01:15
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳采寧
研究生(外文):Tsai-Ning Chen
論文名稱:探究自然語言處理與聊天機器人於營建管理資料查詢處理之應用
論文名稱(外文):Exploring the Application of NLP and Chatbot for Construction Data Searching and Processing
指導教授:陳柏翰陳柏翰引用關係
指導教授(外文):Po-Han Chen
口試委員:曾惠斌荷世平張陸滿林藝馨
口試委員(外文):Hui-Ping TserngShih-Ping HoLuh-Maan ChangYi-Hsin Lin
口試日期:2020-10-30
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:土木工程學研究所
學門:工程學門
學類:土木工程學類
論文種類:學術論文
論文出版年:2020
畢業學年度:109
語文別:中文
論文頁數:95
中文關鍵詞:自然語言處理聊天機器人BERT模型人工智慧營建管理
外文關鍵詞:NLPchatbotBERTAIconstruction management
DOI:10.6342/NTU202100056
相關次數:
  • 被引用被引用:0
  • 點閱點閱:618
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
近年來人工智能(Artificial Intelligence)發展快速,綜觀AI在許多領域的傑出表現,我們可以相信幾乎在任何未來的產業裡「自動化」、「智能化」是勢在必行的趨勢,幾乎每個產業都受益於人工智能而發展得更加快速。然而相對於電子科技業,土木界於此方面的應用可以更多更廣。觀察到現今土木產業的合約、規範等文件資料量龐大,搜尋所需訊息耗費時間長,加上目前大多中小型企業公的方式進行資料的整理查詢,因此希望能利用AI相關子領域:自然語言處理,開發一套問答系統提供土木人員快速搜尋想知道的訊息。此篇論文應用Google於2018年發佈的自然語言處理(NLP)技術Bidirectional Encoder Representations from Transformers (BERT)模型去處理各種文件資訊,增強現有的自然語言模型文件訊息擷取能力,並希望解決因資訊取得不夠快速所造成的許多問題,如工地現場溝通糾紛、效率低落等等。
此篇研究從以往常用的關鍵字搜尋改成語意相似度查詢模式,並配合通訊軟體Line讓使用者能更便利的在常用的通訊軟體介面中使用更強大的自然語言模型去搜尋所需要的資訊,此份研究做出一個聊天機器人為土木人提供一套即時的QA系統,並加入能使模型更理解口語化問答的語料集,可提供使用如工地主任以日常口語詢問的方式做:(1)不同階段、不同實施項目的相關法規(2)案件合約內容(3)材料規範 (4)測試標準 等等查詢。透過精確度測試機制與口語化測試機制,分析實際操作時所遇之問答情況並找出最佳的使用模式,使此系統更符合真實問答系統的操作需求。
Recently, the development of AI has increased dramatically. In overall picture, the performance of AI in various fields has been tremendous. It is very obvious and persuasive that “Automation” and “Intellectualization” is an inevitable but beneficial trend in almost every industry.
Comparing to Electronic Technology Industry, the Civil Engineering Industry certainly has more space and unrevealed potential for the relevant implement. The large consumption of time due to the massive amount of regulations and related contracts in the current civil engineering industry has been noticed, therefore, a professional system is developed with AI relevant technology (Natural Language Processing) specifically for civil engineers to efficiently search for relevant required-information.
This dissertation adopted the Bidirectional Encoder Representations from Transformers (BERT) which is presented by Google in 2018 to process all categories of document materials、enhance the automated data capture capability of the current language model; moreover, to solve the problems caused by inefficient information acquirement such as arguments between customers and workers or schedule delays.
The dissertation aims to design a new system with a combination of BERT and a communication application: Line to produce an immediately-response QA system. In addition, the system has been improved from the traditional key word searching to similar semantics searching; furthermore, the system was provided with oral language database in order to analyze more oral language. The QA system will be able provide the related information of the following categories:
1. The regulations of the different stage、construction items
2. The content of the contract for the designated case
3. The regulations of the designated materials while using in the construction sites
4. The spec or standard for different monitor stage or test
Through accuracy and oral language assessment, the system is expected to provide the most suitable answer to the actual situation.
口試委員會審定書……………………….…………………..…………..………… i
致謝……………………….……………………..………………………..……… ii
摘要……………………….……………………..………………………..…...….. iii
Abstract………..…………………………………………………………...……… iv
目錄……………………………………………………..……………….………… v
圖目錄………………………………………….…………………………..……. viii
表目錄…………………………………………….………………………..……. x
第一章 緒論…………………………………………………………….. 1
1.1 研究背景…………………………..……………………………… 1
1.2 研究問題…………………………..…………………………… 2
1.3 研究目的……………………………………………………… 3
1.4 研究範圍……………………………………………………………..… 5
第二章 文獻回顧………………………………………………………….. 6
2.1土木業界文件處理之現況與系統發展……………………..….… 7
2.1.1 土木營建管理文件現況………………..…………..….…… 7
2.1.2 現今文件管理系統問題與資訊整理方式……………….… 8
2.2 自然語言處理及預訓練模型之發展與特色………………………… 10
2.2.1 自然語言處理之發展…………………………………………… 10
2.2.2 預訓練模型……………………………………………………… 13
2.3 聊天機器人……………………………………..…..………………… 17
2.4 小結…………………………………………..……..……………...…… 21
第三章 研究方法…………………………………………………….…….….. 22
3.1 研究流程………………………………………………………..……… 22
3.2 需求分析方法……………………………………………….……….. 24
3.2.1 專家訪談……………..………………………….…………… 24
3.2.2 5-WHY分析法…………………………..…….……………. 24
3.3 開發工具…………………………………………………………. 27
3.3.1 Colaboratory……….…………….……………………….. 27
3.3.2 Bidirection Encoder Representations from Transformers 29
3.3.3 Line 聊天機器人………...…….…..…………………………….. 34
第四章 研究成果……………………………………………..……………........ 40
4.1 需求分析……………………..……………………………………….… 40
4.1.1 5-WHY分析法應用………………..……………………………. 40
4.1.2 訪談內容……………………..……..…………………………. 43
4.2 資料準備……………………..…………………….………………….. 45
4.2.1 資料收集……………..……………..………………………….. 45
4.2.2 題目設計……………..……………..………………………… 46
4.2.3 資料處理……………..……………..…………………………… 49
4.3 建構符合要求之BERT模型.…………………….…………………. 55
4.3.1 加入台達閱讀理解資料集………...………………………… 55
4.3.2 BERT模型訓練…………………....………………………… 58
4.3.3 模型預測結果……...……………....…………………………. 60
4.4 整合Line 聊天機器人與測試.….………….…………………….. 65
4.5 研究過程中遇到的問題………………...……….…………………..…. 67
4.5.1 問題改善方法……...……………....…………….……….. 67
4.6 模型口語化程度測試………………...……….…………………..…. 71
4.7 使用者操作流程………………………...……….…………………..…. 74
第五章 結論與建議….…………………………………………………..…. 75
5.1 結論……………………..…………………………………….……. 75
5.2 建議…………………….……………………...…………………… 76
參考文獻…………………………………………………………..…………. 77
附錄A 聊天機器人實際操作記錄……………………………………………. 81
A.1 完整合約問答實況………………………………………….…………. 81
A.2 口語化問答實際測試……………………..………………………...…. 83
附錄B 模型回覆有答案者實際測試結果……….………………..….…………. 85
Christopher D. Manning & Mihai Surdeanu & John Bauer & Jenny Finkel & Steven J. Bethard & David McClosky. (2014),“The Stanford CoreNLP Natural Language Processing Toolkit”, Proceedings of 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations,pp.56-60
Erik Rosvall. “ Comparison of sequence classification techniques with BERT for named entity recognition” (2019). Master in Machine Learning, School of Electrical Engineering and Computer Science
Jacob D. & Ming-Wei Chang & Kenton Lee & Kristina T. (2019), "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding", Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Association for Computational Linguistics , Vol.1, pp. 4171-4186
Matthew P. & Mark N. & Mohit I. & Matt G. & Christopher C. & Kenton Lee & Luke Z., (2018), "Deep Contextualized Word Representations", Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Association for Computational Linguistics, Vol. 1, pp.2227-2237
Niloofar Safi S. & Parth P. • Srinivas P. & Prerana M. & Amitava D. & Thamar S. (2020), "Aggression and Misogyny Detection using BERT: A Multi-Task Approach", Proceedings of the Second Workshop on Trolling, Aggression and Cyberbullying, ELRA, pp.126-131
Peters F. (2018), "Design and implementation of a chatbot in the context of customer support", Master Thesis, University of Liège - Faculty of Applied Sciences
Prakash N. & Lucila Ohno-Machado & Wendy C. (2011), "Natural language processing: an introduction", Journal of the American Medical Informatics Association, Vol. 18, Issue 5, pp.544-551
Salim A. (2019), "ARTIFICIAL INTELLIGENCE BASED CHATBOT FOR HUMAN RESOURCE USING DEEP LEARNING", MTECH, DOI: 10.13140
Tom Young & Devamanyu H. & Soujanya P. & Erik C., (2018), "Recent Trends in Deep Learning Based Natural Language Processing", IEEE Computational Intelligence Magazine, IEEE, Vol. 13, Issue 3
XiPeng Qiu & TianXiang Sun & YiGe Xu & YunFan Shao & Ning Dai & XuanJing Huang, 2020 "Pre-trained models for natural language processing: A survey", Science China Technological Sciences, Vol.63, pp.1872-1897

江柏勳,基於自然語言處理技術之網路文件問答系統,碩士論文,國立成功大學資訊工程學系研究所,台南市,2005。
宋堯正,資料採礦分析法於解析客訴不良品之應用–以TFT-LCD製造廠某 C 公司為例,碩士論文,國立中央大學工業管理研究所,桃園市,2013。
李忠憶,營建工程生命週期文件管理系統雛型-以某營造公司為例,碩士論文,國立中山大學資訊管理學系研究所,高雄市,2016。
李勝凱,聊天機器人應用之探討—以南華大學資管系為例,碩士論文,南華大學科技學院資訊管理學系研究所,嘉義縣,2018。
林柏君,我國營造業之發展現況與趨勢,經濟前瞻174期,頁43-48,2017。
唐楷勝,維護管理導向橋梁生命週期文件管理系統之建立,碩士論文,國立中央大學土木工程學系營建管理研究所 ,桃園市,2012。
夏鶴芸,應用自然語言處理技術分析文學小說角色之關係:以互動視覺化呈現,碩士論文,國立臺北大學資訊管理研究所,台北市,2020。
陳威翰,運用自然語言處理技術輔助工程專案合約利害關係人平台之研究,碩士論文,國立中央大學土木工程學系營建管理研究所,桃園市,2020。
陳育毅,以自然語言對話理解顧客購屋喜好認知之聊天機器人,碩士論文,國立中興大學資訊管理研究所,桃園市,2020。
陳博一,以 Line Bot設計與自然語言處理技術監控家電設備運作,建國科技大學電子工程研究所,碩士論文,彰化縣,2019。
郭哲瑜,建築工程施工階段電子履歷系統之建置,碩士論文,中華大學,新竹市,2010。
彭俊彥,應用自然語言處理於自動化資訊擷取-以資訊產品規格之擷取為例,碩士論文,國立交通大學管理學院(資訊管理學程)研究所,新竹市,2005。
彭昱傑,聊天機器人系統設計與實作,碩士論文,國立中正大學資訊工程研究所 ,嘉義縣,2017。
黃慧瑜,深度學習中序列模型之去偏見化訓練方法-以去除聊天機器人的性別職業偏見為例 ,碩士論文,國立交通大學資訊學院資訊學程,新竹市,2018。
黃敏哲,應用AI聊天機器人嵌入式創新擴散理論提高語言學習性能,碩士論文,國立臺北教育大學理學院資訊科學系研究所,台北市,2020。
黃俊霖,自然語言處理研究與應用,碩士論文,國立雲林科技大學資訊工程系,雲林縣,2018。
楊雅嵐,對話式服務應用範圍與價值之探索性研究–以臺灣 Chatbot 業者為例,碩士論文,國立中央大學資訊管理學系,桃園市,2018。
劉挺、張偉男,聊天機器人技術的研究發展,中國人工智慧學會通訊,第6卷第1期,2016。
邱昱雯,自然語言處之專利分析研究,碩士論文,國立臺北大學智慧財產權研究所,台北市,2019。
蕭景中,RCA根本原因分析與案例實作-以音樂盒故障排除為例,碩士論文,國立中正大學通訊資訊數位學習碩士在職專班,嘉義縣,2017。
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊