跳到主要內容

臺灣博碩士論文加值系統

(100.28.2.72) 您好!臺灣時間:2024/06/16 07:43
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:李素杏
研究生(外文):LEE, SU-HSING
論文名稱:運用文字探勘進行議員提案分案之研究-以新北市議會為例
論文名稱(外文):Using Text Mining to Classify the Classification of the Councilors' Proposals - Take New Taipei City Council for Example
指導教授:劉基全劉基全引用關係
指導教授(外文):LIOU, JI-CHYUAN
口試委員:阮金祥李智明劉基全
口試委員(外文):ROAN, JIN-SHYANGLEE, CHIH-MINGLIOU, JI-CHYUAN
口試日期:2023-05-04
學位類別:碩士
校院名稱:致理科技大學
系所名稱:企業管理系服務業經營管理碩士班(含碩士在職專班)
學門:民生學門
學類:其他民生學類
論文種類:學術論文
論文出版年:2023
畢業學年度:111
語文別:中文
論文頁數:151
中文關鍵詞:文字探勘詞袋模型TF-IDF議員提案
外文關鍵詞:Text MiningBag-of-words ModelTF-IDFCouncilors' Proposals
相關次數:
  • 被引用被引用:1
  • 點閱點閱:155
  • 評分評分:
  • 下載下載:47
  • 收藏至我的研究室書目清單書目收藏:0
  資訊發展是社會進步的重要條件,各行各業皆然,而政府組織亦在其中。議員身為民意代表,自應為民喉舌以提升地方建設,或人民居住環境的安全,每年經由議員提出的議員提案日益增多,其內容經常包含不同字串的任意組合,某些字句看起來相似但意思不同,某些則有跨局處的涵意難以辨別權責,凡此種種,讓分案變得困難。甚至須由市府長官裁示方能確認負責單位。這樣的作業流程非常耗費人力時間且冗長費時,甚至會耽誤到人民的生命財產安全。因此本研究想運用文字探勘技術,透過機器學習方式來自動分案,以快速提升議會的效率與服務品質。
  本研究運用Jieba斷詞技術進行中文斷詞及詞袋模型找出議員提案的關鍵詞,並使用WEKA應用軟體之J48決策樹、隨機森林、支援向量機三種分類方法所預測的結果,藉以驗證議員提案自動分類的準確率。最後本研究經各種模型分析後得知,以1800維且使用停用詞之隨機森林分類方法其準確率84.9741%最高,因此本研究採用以1800維且使用停用詞之隨機森林建構的分類方法來建立議員提案的分案機制,藉此讓分案流程更明確、更有效率,以節省人力及時間,並保障公共財產及守護民眾權益安全。

  The development of information is an important condition for social progress. It is true in all industries and government organizations are also included in it. As representatives of public opinion, councilors should speak for the people to improve local construction or the safety of people's living environment. Every year, more and more proposals are put forward by councilors. The content often contains arbitrary combinations of different strings. Some words look similar but the meanings are different. Some meaning of across bureau is difficult to distinguish between rights and responsibilities. All these make it difficult to divide cases. The responsible unit can even be confirmed by the head of the municipal bureau. Such an operating process is very labor-intensive, lengthy and time-consuming; even have an impact on the safety of people's life and property. Therefore, this study intends to use text mining technology to automatically divide cases through machine learning, so as to quickly improve the efficiency and service quality of council.
  This study uses Jieba word segmentation technology to perform Chinese word segmentation and bag-of-words model to find out the keywords of councilors' proposals. Using the results predicted by three classification methods of J48 decision tree, random forest and support vector machine of WEKA application software to predict the results and verify the accuracy of the automatic classification of proposals. Finally, after analyzing various models in this study, it is known that the random forest classification method with 1800 dimensions and using stop words has the highest accuracy rate of 84.9741%. Therefore, this study adopts the classification method established by random forest with 1800 dimensions and using stop words to establish the case division mechanism of councilors' proposals. This will make the case division process clearer and more efficient, save manpower and time, and protect public property and protect the rights and interests of the public.

誌謝 I
摘要 II
ABSTRACT III
目錄 V
圖目錄 VII
表目錄 XVI
第一章 緒論 1
第一節 研究背景 1
第二節 研究動機 4
第三節 研究目的 5
第四節 研究流程 7
第五節 研究限制 8
第二章 文獻探討 9
第一節 議員提案相關研究 9
第二節 文字探勘相關應用及研究 12
第三節 文字探勘方法所做之相關研究 17
第三章 研究方法 25
第一節 研究架構 25
第二節 資料來源 26
第三節 資料前置處理 28
第四節 資料分析方法 29
第五節 WEKA的操作步驟 39
第四章 資料分析 43
第一節 資料前置處理 43
第二節 Jieba斷詞方法 45
第三節 詞袋模型方法 49
第四節 原始資料分析建立預測模型 51
第五節 原始資料分析建立預測模型(排除筆數少之類別) 78
第六節 原始資料分析建立預測模型(重新取樣) 105
第七節 原始資料分析建立預測模型(排除筆數少之類別且重新取樣) 120
第八節 資料分析結論 135
第五章 結論與建議 140
第一節 結論 140
第二節 建議 145
參考文獻 147

一、中文部分
尹其言、楊建民,2010,「應用文件分群與文字探勘技術於機器學習領域趨勢分 析以SSCI資料庫為例」,長榮大學學報,第14卷第2期,頁1-16。
王貿,2020,「公務人員關注議題之文字探勘:以PTT公職板為例」,調查研究-方法與應用,第45期,頁119-154。
王雅芬,2017,「應用文字探勘技術於台北市政府施政滿意度分析」,淡江大學統計學系碩士班碩士論文。
王楷文,2021,「以文字探勘技術探討通訊軟體中共識凝聚過程」,國立臺北科技大學資訊與財金管理系碩士論文。
石偉源、何篤光,2020,「應用文字探勘法分析大數據時代體育研究發展趨勢」,體育學報,第53卷第4期,頁439-451。
江永昌,2008,「臺北縣議會合議制決策取向變遷之研究」,國立臺灣師範大學政治學研究所在職進修碩士班碩士論文。
何崑棋,2020,「大數據應用於零售通路之銷售預測模式-以A公司為例」,國立中正大學企業管理學系碩士在職專班碩士論文。
何紹宇,2022,「整合飢餓遊戲搜索和決策樹算法網絡進行霸凌檢測」,國立雲林科技大學資訊管理系碩士論文。
余顯漁,2019,「Facebook粉絲頁關鍵使用者形象分析研究」,銘傳大學資訊工程學系碩士班碩士論文。
吳承恩,2022,「文本探勘工具運用於檔案自動化主題分類之研究-以《總裁批簽》檔案為例」,國立政治大學圖書資訊與檔案學研究所碩士論文。
吳明賢,2022,「應用文字探勘於社群媒體貼文探討-以知識型粉絲專頁為例」,東吳大學企業管理學系碩士論文。
呂家和,2022,「大數據應用於證券業之研究–以E證券公司為例」,輔仁大學金融與國際企業學系金融碩士在職專班碩士論文。
李雅婷,2022,「政府資料開放應用:交通事故嚴重性與自然因子探討」,國立彰化師範大學地理學系碩士論文。
周麗敏,2013,「組織變革認知對組織承諾之影響研究-以新北市議會機關改制為例」,國立政治大學行政管理碩士學程碩士論文。
林孟翰,2011,「基於中文斷詞技術之新聞網頁分類系統」,淡江大學資訊工程學系碩士班碩士論文。
林渝翔,2011,「一個產生長詞與新詞的中文混合斷詞系統」,元智大學資訊管理學系碩士論文。
范揚崢,2022,「利用文字探勘探討遊戲學習研究趨勢」,淡江大學教育科技學系碩士班碩士論文。
徐捷,2021,「機器學習於社群媒體國軍申訴分類之研究」,元智大學資訊管理學系碩士論文。
袁梅宇,2016,王者歸來:WEKA機器學習與大數據聖經,第3版(台北:佳魁資訊股份有限公司)。
張郁駿,2022,「文字探勘用於國內外物聯網資安檢測標準比對分析之研究」,國立臺北科技大學資訊與財金管理系碩士論文。
張浩也,2022,「南投縣縣議員的社會網絡分析:以第十七屆和第十八屆的議會提案為例」,國立暨南國際大學公共行政與政策學系碩士論文。
張鴻彬,2022,「機器學習於國防安全文本分類之研究」,元智大學資訊管理學系碩士論文。
許值瑋,2021,「應用文字探勘進行新聞自動分類之研究」,國立高雄大學資訊管理學系碩士班碩士論文。
郭秋勤,2020,「整合模擬退火法與支援向量機進行個人小額信用貸款違約之預測研究」,長榮大學高階管理碩士在職專班(EMBA)碩士論文。
陳王正源,2011,「臺北縣議會審查委員會功能與運作之研究」,中國文化大學政治學系碩士論文。
陳世榮,2015,「社會科學研究中的文字探勘應用:以文意為基礎的文件分類及其問題」,人文及社會科學集刊,第 27卷第4期,頁683-718。
陳品蓉,2022,「尋找產業趨勢-運用新聞文字探勘與投信買賣超」,國立雲林科技大學財務金融系碩士論文。
陳奕全,2022,「行銷文字對不動產成交價之影響與預測:文字探勘法」,國立政治大學財務管理學系碩士論文。
陳姵伶,2022,「租賃市場之租金分析與預測」,國立臺北科技大學人工智慧與大數據高階管理雙聯碩士學位學程碩士論文。
陳彥龍,2020,「中文斷詞方法之研究與實作」,國立暨南國際大學資訊工程學系碩士論文。
陳思瑾,2017,「大數據應用對新產品開發績效之影響-以產品特性為干擾變數」,淡江大學企業管理學系碩士班碩士論文。
陳虹霈,2019,「結合卷積神經網路與遞迴神經網路於自動文本分類」,東吳大學數學系碩士論文。
陳泰宇,2020,「k折交叉驗證檢驗均方誤差的偏誤和變異數之間的抵換關係:模擬研究」,國立清華大學經濟學系碩士論文。
陳寬裕,2020,Python網路文字探勘入門到上手(台北:五南圖書出版股份有限公司)。
陳憶瑄,2022,「以文字探勘分析社群媒體情緒對於股市報酬率之影響:以臺灣中大型股為例」,國立臺灣師範大學管理研究所碩士論文。
黃展望,2022,「運用大數據建構錫膏檢測與生產良率品質管制之研究」,國立臺北科技大學人工智慧與大數據高階管理雙聯碩士學位學程碩士論文。
黃純敏、李亞哲、陳柏宏,2015,「以維基百科為基礎之中文縮寫詞與同義詞庫建構」,資訊管理學報,第22卷第2期,頁117-140。
新北市政府民政局:https://www.ca.ntpc.gov.tw/home.jsp?id=b1fc41390d4c9336。2022/11/08。
新北市議會全球資訊中文網:https://www.ntp.gov.tw/。2022/07/20。
楊沛婕,2021,「應用文字探勘技術進行高等教育課程資源之永續發展目標自動分類」,國立高雄大學資訊管理學系碩士班碩士論文。
楊宗晟,2019,「文字探勘在線上顧客評論分析之應用」,明新科技大學資訊管理系碩士班碩士論文。
楊峒禹,2017,「Rapidminer大數據挖掘於成人健康檢查之慢性病預防」,朝陽科技大學資訊工程系碩士論文。
蔡欣倫、魏慧美、郭隆興,2021,「資料探勘技術建構教師雙語教學研習預測模型」,科學與人文研究,第9卷第1期,頁14-29。
蔡欣倫、魏慧美、郭隆興,2022,「以資料探勘技術預測影響大學教師評價學校的因素」,科學與人文研究,第9卷2期,頁24-38。
鍾錦毅,2019,「運用機器學習技術建構糖尿病病患罹患結核病之死亡風險預測模型」,國立中正大學資訊管理系醫療資訊管理研究所碩士論文。
二、英文部分
Cheng, L. C., Lin, W. S., & Lien, Y. H. 2021. “A Hybrid Deep Learning Model for Predicting Stock Market Trend Prediction,” International Journal of Information and Management Sciences, vol. 32, no. 2, pp. 121-140.
Jiang, T., Bao, J., Hou, B., & Li, Y. 2022. “Predicating Loan Risk with Machine Learning Algorithm,” International Core Journal of Engineering, vol. 8, no. 2, pp. 275-283.
Kim, J. M., Xiao, X., & Kim, I. 2020. “Hollywood movie data analysis by social network analysis and text mining,” International Journal of Electronic Commerce Studies, vol. 11, no. 1, pp. 75-91.
Kim, J. & Park, Y. 2019. “Leveraging ideas from user innovation communities: using text‐mining and case‐based reasoning,” R&D Management, vol. 49, no. 2, pp. 155-167.
Liu, X., Chen, S., & Xiong, L. 2020. “Research on User Donation Preference of" Internet + Public Benefit" Project-Take Taobao Public Welfare as An Example,” International Journal of Social Science and Education Research, vol. 3, no. 1, pp. 72-78.
Qiao, S. 2022. “Analysis on the Evolution of Word-of-mouth Research under Text Mining and Bibliometric Analysis: Based on Web of Science Data,” Frontiers in Economics and Management, vol. 3, no. 2, pp. 170-178.
Salzberg, S. L. 1997. “On comparing classifiers: pitfalls to avoid and a recommended approach,” DataMining and Knowledge Discovery, vol. 1, no. 3, pp. 317-328.
Su, M. Y., Chang, J. Y., & Fung, K. T. 2019. “Android Malware Detection Approaches in Combination with Static and Dynamic Features,” International Journal of Network Security, vol. 21, no. 6, pp. 1031-1041.
Xiao, H. 2022. “Analysis of Online Short Rent Platform Reviews Based on Text Mining,” World Scientific Research Journal, vol. 8, no. 1, pp. 110-116.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊