跳到主要內容

臺灣博碩士論文加值系統

(98.80.143.34) 您好!臺灣時間:2024/10/04 16:36
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:葉家安
研究生(外文):YEH, CHIA-AN
論文名稱:運用文字採礦解析近年風險管理與保險學術期刊的趨勢與特徵
論文名稱(外文):Analyzing the Recent Trends and Features of Academic Journals of Risk Management and Insurance by Using Text Mining
指導教授:余泰毅余泰毅引用關係邵靄如邵靄如引用關係
指導教授(外文):YU, TAI-YISHAO, AI-JU
口試委員:王錦瑩張益誠
口試委員(外文):WANG, JIN-YINGCHANG, I-CHENG
口試日期:2020-05-21
學位類別:碩士
校院名稱:銘傳大學
系所名稱:風險管理與保險學系碩士班
學門:商業及管理學門
學類:風險管理學類
論文種類:學術論文
論文出版年:2020
畢業學年度:108
語文別:中文
論文頁數:75
中文關鍵詞:中文斷詞文字探勘保險DTMK-means
外文關鍵詞:Text miningChinese textInsuranceDTMK-means
相關次數:
  • 被引用被引用:0
  • 點閱點閱:278
  • 評分評分:
  • 下載下載:28
  • 收藏至我的研究室書目清單書目收藏:0
  本研究以國內的保險相關學術期刊(含TSSCI期刊)做為研究對象,進行文字採礦與多變量分析,進行文章與主題的分類。文字採礦方面,運用python與CKIP進行中文斷詞,運用K-means對於TF-IDF及DTM矩陣進行分群,同時進行視覺化分析,學術文章為2006~2019年的已公開學術期刊,透過期刊的名稱、摘要與關鍵詞,進一步分類與分析隱涵且有用的資訊,辨識研究趨勢及各主題的發展特徵。
  運用K-means的年度主題分類結果,透過新聞媒體的時事發展,可以清楚評析文字採礦結果的合理性與趨勢。分群後的文字探勘 DTM矩陣配合關聯性分析,可以將學術期刊分為8類,運用文字雲的視覺化分析結果以及關聯性分析可以展現各類別之關鍵詞彙,因此,運用 K-means分類技術進行文字採礦的主題分類結果,可以提供良好的分類效果,同時提供各類別的關鍵詞重要性以及關聯性。
  This research examines articles published in domestic insurance-related academic journals (including TSSCI journals) as the research object by applying text mining and multivariate analysis to classify articles and themes. For text mining, python and CKIP has been performed for Chinese word segmentation while K-means used for the TF-IDF and DTM matrix grouping analysis. The data visualization is also conducted. Analyzed articles are those published in the studied journals from 2006 to 2019. This study attempts to classify and look into hidden and useful information to identify research trends and development characteristics of each relevant theme by analyzing the titles, abstracts and keywords of published articles in the studied journals.
  In text mining, python and CKIP packages were performed for Chinese word segmentation, while the K-means technique used for grouping analysis with the TF-IDF and DTM matrix, and data visualization was also conducted. Analyzed articles are those published in the studied journals from 2006 to 2019, and this study attempts to classify and look into hidden and useful information to identify research trends and development characteristics of each relevant theme by analyzing the titles, abstracts and keywords of published articles in the studied journals.
  The sorting of the annual themes by K-means, based on news media's development in current affairs, helps this research to clearly evaluate the rationality and trends of text mining results. Journal articles in the study could be categorized into 8 types with the techniques of document term matrix (DTM)and correlation analyses. Critical terms in each category are further displayed as results of the visualization and correlation analyses with the application of the word cloud software. Therefore, the K-means classification technique is found to be good and applicable for efficient sorting results in text mining, highlighting the importance and relevance of keywords in each respective category.
目 錄 I
圖 目 錄 III
表 目 錄 IV
第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 2
第三節 研究步驟 4
第四節 研究範圍與限制 5
第五節 預期結果 8
第二章 文獻探討 9
第一節 文字探勘之定義與應用 9
第二節 本研究使用之輔助加權工具介紹 16
第三章 研究方法 25
第一節 研究架構 25
第二節 中文斷詞工具 27
第三節 文本選擇與資料格式轉換 27
第四節 斷詞處理 29
第五節 TF-IDF及DTM 30
第六節 主題趨勢分析 31
第七節 集群分析 32
第八節 成果詮釋 35
第四章 資料分析 36
第一節 中文斷詞 36
第二節 研究資料之集群分析 38
第三節 研究資料時序分析與視覺化呈現 51
第五章 結論 56
第一節 研究結果 57
第二節 研究建議 58
參考文獻 60
英文文獻 60
中文文獻 62
附錄 66

英文文獻
Baeza-Yates, R. and B. Ribeiro-Neto. 1999. Modern Information Retrieval, Addison Wesley Press.
Chen, K. J. and Liu, S. H., 1992. Word Identification for Mandarin Chinese sentences, Proceedings of Fifth International Conference on Computational Linguistics. 101-107.
Dahlaman, C. and Thomas, A. 2000. Korea and the Knowledge-based Economy: Making the Transition. Paris: OECD.
Deogun, J. S., Sever, H. and Raghavan, V. V. 1998. Structural abstractions of hypertext documents for web-based retrieval. Proceeding of Ninth International Workshop on Database and Expert Systems Applications: 385-390.
Goldberg, D. E. 1989. Gene Algorithm in Search, Optimization and Machine Learning. Addison-Wesley, New York.
Gromovyi, M. V., Romanenko, V. I., Mieth, S., Halfmann, T., and Yatsenko, L. P., 2011. Storage and retrieval of coherent optical information in atomic populations. Optics Communications 284(24): 5710-5718.
Haralampos Karanikas and Babis Theodoulidis Manchester. 2001. Knowledge Discovery in Text and Text Mining Software. Centre for Research in Information Management, UK.
He, W. 2011. Using text mining to uncover students' technology‐related problems in live video streaming. British Journal of Educational Technology 42(1): 40-49.
Heller, K., and Ghahramani, Z. 2005. Bayesian hierarchical clustering. ACM International Conference Proceeding Series; Vol. 119, Proceedings of the 22nd international conference on Machine Learning, 297-304.
Hsu, F. M., and Fang, C. T. 2015. The Trend and Intellectual Structure of Digital Archives Research.
Ingvaldsen, J. E., and Gulla, J. A. 2012. Industrial application of semantic process mining. Enterprise Information Systems 6(2): 139-163.
Justin Grimmer, Brandon M. Stewart. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis 21(3): 1-31.
Kim, S. 2009. Content analysis of cancer blog posts. Journal of the Medical Library Association: JMLA, 97(4), 260.
Lavrac, N. 1999. Selected techniques for data mining in medicine. Artificial Intelligence in Medicine 16: 3-23.
Li, B. Y., Lien, S., Sun, C. F. and Sun, M. S., 1991. A Maximal Matching Automatic Chinese Word Segmentation Algorithm Using Corpus Tagging for Ambiguity Resolution, R.O.C. Computational Linguistics Conference 135-146.
Losiewicz, P., Oard, D. W. and Kostoff, R. N. 2000. Textual data mining to support science and technology management. Journal of Intelligent Information Systems 15: 99-119.
Luhn, H.P., 1957. A Statistical Approach to Mechanized Encoding and Searching of Literary Information. IBM Journal of Research and Development 1(4): 309-317.
Madsen, R.E., D. Kauchak, and C. Elkan. 2005. Modeling Word Burstiness Using the Dirichlet Distribution, Proceedings of the 22nd International Conference on Machine Learning, 545-552.
Maulik, U., and Bandyopadhyay, S. 2000. Genetic algorithm-based clustering technique. Pattern Recognition 33: 1455-1465.
Mayer-Schönberger, V., and Cukier, K. 2013. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Boston, MA: Houghton Mifflin.
Meystre, S. and Haug, P. J. 2005. Automation of a problem list using natural language processing. BMC Medical Informatics and Decision Making, 5(30).
Miner, G., Elder IV, J., and Hill, T. 2012. Practical text mining and statistical analysis for non-structured text data applications. Academic Press.
Moretti, S. 2006. Minimum Cost Spanning Trees Situations and Gene Expression Data Analysis. ACM International Conference Proceeding Series, Vol. 199, Proceedings form the 2006 workshop on Game theory for Communications and Networks.
Nie, J. Y., Briscbois, M., and Ren, X., 1996. On Chinese Text Retrieval, Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, 225-233.
Oh, S., and Park, M. S. 2013. Text mining as a method of analyzing health questions in social QandA. Proceedings of the American Society for Information Science and Technology 50(1): 1-4.
Ono, H., Takabayashi, K., Suzuki, T., Yokoi, H., Imiya, A. and Satomura, Y. 2004. Extraction of diagnosis related terminological information from discharge summary. IEIC Technical Report 103(295): 13-18.
Poter, M. E,. 1985. Competitive Advantange, New York: Free Press.
Romero, C., and Ventura, S. 2010. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 40(6), 601-618.
Romero, C., Ventura, S., and García, E. 2008. Data mining in course management
Salton, G., and Buckley, C., 1988. Term Weighting Approaches in Automatic Information Retrieval. Journal of Information Proceeding and Management 24: 513-524.
Salton, Allan and Buckley, 1994 ; Chen, Lin and Ho, 2013. Salton, G., Allan, J., and Buckley, C. (1994). Automatic structuring and retrieval of large text files. Communications of the ACM, 37(2), 97-108.
Salton, G., and McGill, M. J., Introduction to modern information retrieval, McGraw-Hill, 1983.
Salton, G., and C. Buckley., 1988. Term-weighting approaches in automatic text retrieval. Information Processing and Management 24(5): 513-523.
Salton, G., and McGill, M., 1983. Introduction to Modern Information Retrieval, McGraw-Hill.
Spärck Jones, K., 1972. A Statistical Interpretation of Term Specificity and its Application in Retrieval. Journal of Documentation 28(1): 11–21.
Sproat, R., and Shih, C., 1990. A Statistical Method for Finding Word Boundaries in Chinese Text. Computer Processing of Chinese and Oriental Languages 336-351.
Sullivan, D. 2001. Wiley Computer Publishing. systems: Moodle case study and tutorial. Computers and Education. Document Warehousing and Text Mining 51(1): 368-384.
Tan, A. H. 1999. Text mining: The state of the art and the challenges. InProceedings of the PAKDD 1999 Workshop on Knowledge Disocovery from Advanced Databases 8: 65-70.
Trivedi, A., Medonca, A.E., Johnson, B.S., 2004. Using Machine Learning for Classifying Documents and Extracting Features,11th World Congress of Medical Information.
Vinodhini, G., and Chandrasekaran, R. M. 2012. Sentiment analysis and opinion mining: a survey. International Journal 2(6).
Wang, H., and Ohsawa, Y. 2013. Idea discovery: A scenario-based systematic approach for decision making in market innovation. Expert Systems with Applications 40(2): 429-438.
Wen Zhang and Taketoshi Yochida and Xijin Tang. 2011. A comparative study of TF*IDF, LSI and multi-words for text classification. Expert Systems with Applications 38(3): 2758-2765.
Zikopoulos, P., and Eaton, C. 2011.Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data. New York: McGraw-Hill.

中文文獻
(期刊)
尹其言與楊建民,2010,應用文件分群與文字探勘技術於機器學習領域趨勢分析以SSCI資料庫為例,長榮大學學報,第14期第2卷:1-16。
朱家德與龍玉玲,2018,大數據應用-舞弊預防與偵查,月旦會計實務研究,第6期:47-53。
陳文華、徐聖訓、施人英與吳壽山,2003,應用主題地圖於知識整理,圖書資訊學刊,第1期第1卷:37-58。
黃裕烈與管中閔,2019,美國聯準會會議紀要的文字探勘與台灣經濟變數預測,經濟論文叢刊,第47期第3卷:363-391。
黃嘉彥與楊竣徨,2013,運用文字探勘建置專利技術功效矩陣之成效評估,創新與經營管理學刊,第4期第2卷:162-176。
葉乃菁、王玳琪、張嘉珍、吳騏與賴志遠,2009,建構創新政策研究工具--文字探勘之應用簡介,國研科技,18-20。
張謙、蔡爾行、莊嘉茵 (2007)。語言訊息處理。載於陳烜之(主編),認知心理。
廖怡欽、羅尹呈與張維倫,2017,快速雲端k-means 分群方法初探,高雄應用科技大學工程科技學刊,第3期第2卷:35-43。

(專題研討會與未出版之學位論文)
王秀茹,2009,應用資料探勘於客戶線上購買保險行為之分析,中國文化大學資訊管理研究所碩士論文,台北市。
曾元顯,2004,專利文字之知識探勘:技術與挑戰,現代資訊組織與檢索研討會。
余采蓓,2017,運用文字探勘技術探討性相關議題之研究-以 PTT 論壇 feminine sex 板為例,樹德科技大學人類性學所碩士論文,高雄市。
吳瑞川,2004,資料探勘技術應用於保險業-以壽險保障為例,東吳大學數學及統計所碩士論文,台北市。
李安唐,2006,電子病歷自動分類於ICD-9-CM,慈濟大學醫學資訊所碩士論文,花蓮縣。
李昱儒,2020,不可不知的旅遊保險—利用文字探勘技術發掘消費者關注面向,國立臺灣科技大學企業管理所碩士論文,台北市。
林志鎧,2018,保險業的資料探勘應用—壽險高潛力客戶,國立中央大學資訊管理學系在職專班碩士論文,桃園市。
林育宏,2002,建構可供資料採擷之壽險客戶關係管理模式,國立高雄第一科技大學風險管理與保險所碩士論文,高雄市。
林清河,2003,知識管理在服務創新之應用,國立成功大學工業管理科學系碩士論文,台南市。
侯宥任,2017,運用KeyGraph演算法與文字探勘探索行動銀行研究之趨勢,國立中正大學資訊管理研究所碩士論文,嘉義縣。
張皓為,2018,以文字探勘技術探討五星級飯店之品牌形象—以老爺酒店為例,真理大學觀光事業學系碩士論文,新北市。
陳克健、陳正佳與林隆基,1986,中文語句的研究-斷詞與構詞,中央研究院。
陳宗權與陳俊育,2016,運用文本探勘技術探索未來科技,科技部105年度自行研究計畫成果報告。
陳嘉葳,2013,用 R 進行中文 text Mining,國立高雄大學資管所。
曾元顯,2019,深度學習之專利分析研究,國立台灣師範大學圖書資訊學碩士論文,台北市。
黃玉婷,2012,以文字探勘技術產製求量刑因子之研究—以我國智慧財產權法律為中心探討,東吳大學法律學系碩士在職專班科技法律組論文,台北市。
黃馨瑩,2016,應用文字探勘於資訊管理領域研究趨勢,銘傳大學資訊管理學系碩士論文,台北市。
楊正銘,2004,以文字探勘技術應用於疾病分類之輔助系統 - 以出入院病歷摘要為例,台北醫學大學醫學資訊所碩士論文,台北市。
潘彩君,2018,以「文字探勘」法檢證習近平時期之中共國際話語權(2012~2017),國防大學戰爭學院戰略研究所,臺北市。
潘揚燊,2016,運用文字探勘分析特定領域語詞組成-以台鐵郵輪列車為例,元智大學工業工程與管理學系碩士論文,桃園市。
鍾麗君,2005,電腦輔助編碼系統在疾病分類與管理上之模擬研究,國立陽明大學醫務管理所碩士論文,台北市。

(網路)
Gartner(2019)。【29 樣必須關注的未來技術】Gartner:「擴增人類」將讓我們擁有鋼鐵人般的體力。取自https://buzzorange.com/techorange/2019/09/02/5-tech-trends/。
Ingo Feinerer. Introduction to the tm Package Text Mining in R, 6-8. December 2019. URL http://cran.uib.no/web/packages/tm/vignettes/tm.pdf
中科大學報,取自https://otc.nutc.edu.tw/files/11-1006-8175-1.php?Lang=zh-tw。
中國統計學報,取自http://jcsa38.stat.ncku.edu.tw/OutWeb/L_CT/AboutUs/AboutUs.asp。
王建興(2014)。從搜尋引擎到文字探勘(上)。取自https://www.ithome.com.tw/voice/90361,2014-09-04發表。
台灣管理學刊,取自http://www.ipress.tw/J0002。
企業管理學報,取自http://www.mba.nptu.edu.tw/files/14-1134-82571,r146-1.php?Lang=zh-tw。
亞太經濟管理評論,取自http://readopac1.ncl.edu.tw/nclJournal/search/guide/detail.jsp?mark=basicanddtdId=000075andsysId=0006508969andla=ch。
兩岸金融季刊,取自https://service.tabf.org.tw/Research/EconomicQuarterlyTeam.aspx。
東吳經濟商學學報,取自http://cbrd.scu.edu.tw/journal/intro。
林公孚(2011),《知識的定義與類型》,2011年8月4日,取自https://blog.xuite.net/lingf01/twblog/141969762-%E7%9F%A5%E8%AD%98%E7%9A%84%E5%AE%9A%E7%BE%A9%E8%88%87%E9%A1%9E%E5%9E%8B。
保險專刊,取自https://www.lawbank.com.tw/treatise/pl_introduction.aspx?PID=PL000100。
保險學報,取自 http://www.isroc.org.tw/Pages/Isroc_FoundedHistory.aspx?Menu=Introduction。
風險管理學報,取自http://www.rmst.org.tw/Pubs/PubIntro。
財金論文叢刊,取自http://finance.cyut.edu.tw/p/412-1025-1412.php?Lang=zh-tw。
評價學報,取自http://www.valuation.org.tw/journal/。
當代商管論叢,取自https://commerce.nutc.edu.tw/files/13-1017-36438.php。
農業經濟叢刊,取自http://www.rest.org.tw/ch/mode03_02.asp?num=20140704160642andpage=1andt=sub。
壽險管理期刊,取自 https://limi.org.tw/News/NewsContent/225。
輔仁管理評論,取自http://www.management.fju.edu.tw/zh-tw/research/plan.php?EID=2。

(報告)
張益誠,中文TM作業服務檔案格式說明,宜蘭大學環工系資管與系分研究室,宜蘭縣。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊