跳到主要內容

臺灣博碩士論文加值系統

(44.200.94.150) 您好!臺灣時間:2024/10/16 15:17
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:謝心妤
研究生(外文):Hsin-Yu Hsieh
論文名稱:圖書館之多層式圖書自動分類系統之實證研究
論文名稱(外文):An Empirical Study of Multi-layered Automatic Book Classification System in Library
指導教授:郭俊桔郭俊桔引用關係
口試委員:陳錦杏徐典裕
口試日期:2019-07-23
學位類別:碩士
校院名稱:國立中興大學
系所名稱:圖書資訊學研究所
學門:傳播學門
學類:圖書資訊檔案學類
論文種類:學術論文
論文出版年:2019
畢業學年度:107
語文別:中文
論文頁數:105
中文關鍵詞:圖書自動分類多層式圖書自動分類系統分類器
外文關鍵詞:automatic book classificationmulti-layered automatic book classification systemclassifier
相關次數:
  • 被引用被引用:1
  • 點閱點閱:303
  • 評分評分:
  • 下載下載:34
  • 收藏至我的研究室書目清單書目收藏:4
圖書館的基礎任務在於文化典藏與提供資訊,圖書館為達此目標,需進行保存整理圖書資料的基礎工作,也就是分類編目作業,當前圖書館對於圖書資料的整理,仍由圖書館的分類編目人員花費大量的時間精神,進行分門別類與組織編目的工作,這樣的人工分類作業,面對各學科領域圖書資料的快速增加,與被高度壓縮的人力時間限制,已感力不從心,若能運用資訊科技,輔助處理圖書分類工作,希望能加速圖書分類處理流程,減輕圖書館分類工作的壓力。
本研究蒐集圖書館實際大量且多類的中文電子書,以圖書館實際圖書分類架構為標準,取用圖書的題名、摘要、目錄等原始書目資料,經過文件斷詞處理、提取文件特徵、構建分類模型等處理程序後,進行分類實驗,發現探討傳統常見機器學習單一單層分類器的成效,同時找出圖書的題名、摘要、目錄及其組合資料集,應用於圖書自動分類表現最佳的內容組合。本研究更進一步探討在大量書目與多樣類目的雙重壓力下,以多層式圖書自動分類器架構,綜合多種單一分類器的優點,找出多層式圖書自動分類表現最佳的分類器組合。實驗結果顯示,本研究之多層式圖書自動分類系統的分類精確率可達97.26%,較以往實驗研究中,傳統單一單層分類器只有約82%的表現,呈現出更佳的分類效能。
The basic task of the library lies in the cultural collection and providing information. In order to achieve this goal, the library needs to carry out the basic work of preserving the books and materials, that is, the classification and cataloguing work. The current library organizes the books and materials, and is still classified by the cataloging staff. They spends a lot of time and spirit, and works on the books of classification and organization cataloging. Such manual classification work are faced with the rapid increase of books and materials in various subject areas, and the highly compressed manpower time limit, have been powerless. If we can tyr to use the information technology to assist in the processing of book classification, we hope to speed up the process of book classification and reduce the pressure on library classification work.
In this study we collects a large number of Chinese e-books in the library, based on the actual library classification structure of the library is used as the experiment’s standard. We use the original bibliographic data such as the title, abstract, and catalogue of the book, after tokenizing process of the file, extracting the features of the file, and constructing the classification model. Then we can conduct classification experiments and discover the effectiveness of traditional single-layered machine classifiers for common machine learning. At the same time, we try to find out the title, abstract, catalog, and combination data set of the book, which one is the best combination of content for automatic classification of books?
This study further explores to combine the advantages of multiple single classifiers with a multi-layered automatic book classifier architecture under the dual pressure of a large number of bibliographies and diverse categories, and finds the best classifier combination for multi-layered automatic book classification. The experimental results show that the classification precision of the multi-layered automatic book classification system in this study can reach 97.26%. Compared with the previous experimental research, the traditional single-layered classifier has only about 82% performance, showing better classification efficiency.
誌 謝 辭 i
摘 要 ii
Abstract iii
目 次 v
表 目 次 viii
圖 目 次 ix
第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 4
第三節 研究問題 5
第四節 研究範圍與限制 5
第五節 名詞解釋 6
第六節 論文架構 7
第二章 文獻探討 8
第一節 圖書分類 8
第二節 文件自動分類 13
第三節 圖書自動分類 26
第四節 小結 31
第三章 研究設計與實施 36
第一節 研究架構 36
第二節 研究步驟 38
第三節 資料蒐集 40
第四節 研究工具 41
第五節 多層式圖書自動分類系統架構 43
第六節 先導實驗 47
第七節 先導實驗小結 52
第八節 正式實驗資料 52
第九節 正式實驗資料處理與整合 57
第十節 正式實驗文件特徵向量表示 60
第四章 研究結果與分析 61
第一節 分類器訓練 61
第二節 分類結果效能評估討論 63
第五章 結論與未來研究方向 74
第一節 結論 74
第二節 未來研究方向 75
參考書目 78
一、中文部分 78
二、西文部分 80
附錄一 中文停用字 83
附錄二 中研院平衡語料庫詞類標記集 84
附錄三 正式實驗一資料集分類號內容 86
附錄四 書目資料原始樣態 103
一、中文部分
卜小蝶(2001)。網路使用者檢索詞彙主題分類探析。知識經濟時代圖書資訊學之展望研討會(台灣大學圖書資訊學系),頁107-118。
中文圖書分類法2007年版修訂委員會(2007)。中文圖書分類法(2007年版)類表編。臺北市:國家圖書館。
王省吾(1980)。圖書分類法導論。臺北市:中國文化大學。
王毓菁(2002)。圖書館閱覽者群組潛在特徵探勘資訊系統(未出版之碩士論文)。華梵大學工業管理學系研究所碩士論文,新北市。
吳慧貞(2015)。使用資料探勘探討多層式圖書自動分類系統之研究(未出版之碩士論文)。國立中興大學圖書資訊學研究所碩士論文,臺中市。
李克強(2006)。運用資料探勘技術從事圖書分類之研究(未出版之碩士論文)。華梵大學資訊管理學系研究所碩士論文,新北市。
林昕潔(2006)。以SVM與詮釋資料設計書籍分類系統(未出版之碩士論文)。國立交通大學資訊科學與工程研究所碩士論文,新竹市。
胡述兆、吳祖善(1989)。圖書館學導論。臺北市:漢美圖書有限公司。
唐仁壕(2017)。新書編目的分類號與主題詞自動推薦研究(未出版之碩士論文)。國立臺灣大學工程科學及海洋工程學研究所碩士論文,臺北市。
張郁蔚(2012)。《杜威十進分類法》與《中文圖書分類法》之文學類分類比較研究。圖書資訊學研究,6(2),頁115-137。
郭俊桔(2018)。使用多數決策略之圖書自動分類的研究。圖書資訊學研究,13(1),頁87-124。
陳光華、羅思嘉、林純如(2002)。圖書資訊學學術期刊文獻主題編目一致性之探討。載於世新大學圖書館編,資訊傳播學術研討會論文集(頁125-142),臺北市:編者。
陳和琴、吳鎦璃、江琇瑛(1996)。圖書分類編目。新北市:國立空中大學。
陳和琴、張慧銖、江綉瑛、陳昭珍(2003)。資訊組織。新北市:國立空中大學。
陳強強(2018)。基於機器學習的中文書目自動分類的研究(未出版之碩士論文)。北方工業大學計算機技術研究所碩士論文,北京市。
曾元顯(2002)。文件主題自動分類成效因素探討。中國圖書館學會會報,68,頁62-83。
曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2005)。資料探勘。臺北市:旗標出版股份有限公司。
黃純敏(2002)。學術論文自動分類技術研討。行政院國家科學委員會專題研究計畫成果報告(計畫編號:NSC90-2416-H-224-016),未出版。
黃淑蘭(1997)。「電腦輔助中文圖書分類系統」 設計初探。中國圖書館學會會報,59,頁61-75。
黃淵泉(1993)。中文圖書分類編目學。台北市:台灣學生書局。
黃嘉宏(2008)。基於自動分類為基礎的圖書題名特徵擷取之研究—以輔助圖書分類系統為例(未出版之碩士論文)。輔仁大學圖書資訊學系碩士論文,新北市。
楊雅婷、阮明淑(2006)。分類相關概念之術語學研究。國家圖書館館刊,95(2),頁25-50。
廖述賢、溫志皓(2012)。資料探勘理論與應用。臺北市:博碩文化股份有限公司。
劉凡平(2017)。大數據時代的算法:機器學習、人工智能及其典型實例。臺北市:松崗資產管理股份有限公司。
駱德廉(2018)。巨量資料分析與智能應用。臺北市:上奇資訊。

二、西文部分
AL-Nabi, D. L. Abd, & Ahmed, S. S. (2013). Survey on classification algorithms for data mining: comparison and evaluation. International Journal of Computer Engineering and Intelligent Systems, 4(8), pp. 18–24.
Avila-Arguelles, R., Calvo, H., Gelbukh, A., & Godoy-Calderon, S. (2010). Assigning Library of Congress Classification Codes to books based only on their titles. Informatica, 34(1), pp.77–84.
Breiman, L., Friedman, J., Stone, C. J., & Olshen, R. A. (1984). Classification and Regression Trees. Taylor & Francis.
Carpineto, C., & Romano, G. (1994). Dynamically bounding browsable retrieval spaces: an application to Galois lattices. Proceeding RIAO '94: Intelligent Multimedia Information Retrieval Systems and Management, 1, pp.533-547.
Chakraborty, V., Chiu, V., & Vasarhelyi, M. A. (2014). Automatic classification of accounting literature. International Journal of Accounting Information Systems, 15(2), pp. 122-148.
Chan, L. M. (1995). Classification, present and future. Cataloging & Classification Quarterly, 21(2), pp.5-17.
Cheng, Patrick T. K., & Wu, Albert K. W. (1995). ACS: an automatic classification system. Journal of Information Science, 21(4), pp. 289-299.
Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20 (3), pp.273–297.
Demırekler, D., & Altınçay, H. (2002). Plurality voting-based multiple classifier systems: statistically independent with respect to dependent classifier sets. Pattern Recognition, 35(11), pp.2365-2379.
Desale, S. K., & Kumbhar, R. M. (2013). Research on automatic classification of documents in library environment: a literature review. Knowledge Organization, 40(5), pp.295-304.
Golub, K., Hagelbäck, J., & Ardö, A. (2018). Automatic Classification Using DDC on the Swedish Union Catalogue. 18th European Networked Knowledge Organization Systems Workshop, NKOS 2018 in CEUR Workshop Proceedings 2200. pp.4-16
Hamill, K. A., & Zamora, A. (1980). The use of titles for automatic document classification. Journal of the American Society for Information Science, 31(6), pp.396 – 402.
IBM (1998). Intelligent Miner for Text: Getting Started. IBM Corp.
Kittler, J., & Alkoot, F. M. (2003). Sum versus vote fusion in multiple classifier systems. IEEE Transactions on Pattern Analysis and Machine Intelligence, 25(1), pp.110–115.
Kumbhar, R. (2012). Library Classification Trends in the 21st Century. Chandos Publishing.
Larkey, L. S., & Croft, W. B. (1996). Combining classifiers in text categorization. Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval (Proceeding SIGIR '96), pp.289-297.
Larson, R. R. (1992). : Experiments in automatic Library of Congress Classification. Journal of the American Society for Information Science (JASIS), 43(2), pp.130–148.
Maron, M. E. (1961). Automatic Indexing : an Experimental Inquiry. Journal of the ACM, 8, pp.404-417.
Mitchell, T. (1997). Machine Learning. McGraw Hill.
Quinlan, J. R. (1986). Induction of decision trees. Machine learning, 1(1), pp. 81-106.
Quinlan, J. R. (1993). C4. 5: programs for machine learning. Morgan Kaufmann Publishers Inc.
Quinlan, J. R. (2004). Data mining tools See5 and C5.0.
Quinlan, J. R. (2014). C4. 5: programs for machine learning. Elsevier.
Ranganathan, S. R. (1931). The five laws of library science. London: Edward Goldston.
Salton, G., & McGill, M. J. (1983). Introduction to modern information retrieval. McGraw-Hill.
Samuel, A. L. (1959). Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development, 3(3), pp.210-229.
Sebastiani, F. (2002). Machine learning in automated text categorization. ACM computing surveys, 34(1), pp.1-47.
Sun, H. F., & Hou, W. (2014). Study on the Improvement of TFIDF Algorithm in Data Mining. Advanced Materials Research, 1042, pp.106-1097.
Tonta, Y. (1991). A Study of Indexing Consistency between Library of Congress and British Library Catalogers. Library Resources and Technical Services, 35(2), pp. 177-85.
Torkkola, K. (2004). Discriminative features for text document classification. Formal Pattern Analysis & Applications, 6(4), pp.301–308.
Wahbeh, A. H., Al-Radaideh, Q. A., Al-Kabi, M. N., & Al-Shawakfa, E. M. (2011). A comparison study between data mining tools over some classification methods. International Journal of Advanced Computer Science and Applications, Special Issue, pp.18-26.
Wang, J. T. L., Marr, T. G., Shasha, D., Shapiro, B. A., Chirn, G. W., & Lee, T. Y. (1996). Complementary classification approaches for protein sequences. Protein Engineering. 9(5), pp.381-386.
Wu, H., & Yuan, N. (2018). An Improved TF-IDF algorithm based on word frequency distribution information and category distribution information. ICIIP '18 Proceedings of the 3rd International Conference on Intelligent Information Processing, pp.211-215.
Yang, Y., & Pedersen, J. O. (1997). A Comparative Study on Feature Selection in Text Categorization. Proceedings of the Fourteenth International Conference on Machine Learning (Proceeding ICML '97), pp.412-420.
Yi, K. (2006). Challenges in Automatic Classification using Library Classification Schemes. The 72nd General Conference of International Federation of Library Associations and Institutions (IFLA).
Yu, F., Zheng, D. Q., Zhao, T. J., Li, S., & Yu, H. (2006). Text Classification Based on A Combination of Ontology with Statistical Method. 2006 International Conference on Machine Learning and Cybernetics, 20 (3), pp.1042-1047.
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊