(3.235.11.178) 您好!臺灣時間:2021/02/26 04:14
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:李克強
研究生(外文):Ke-Jiang Li
論文名稱:運用資料探勘技術從事圖書分類之研究
論文名稱(外文):The Study of Applying Data Mining to Categorize Books
指導教授:朱惠中朱惠中引用關係
指導教授(外文):Huei-Chung Chu
學位類別:碩士
校院名稱:華梵大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2006
畢業學年度:94
語文別:中文
論文頁數:86
中文關鍵詞:圖書分類資料探勘電腦輔助系統
外文關鍵詞:Data MiningData MiningComputer Aided System
相關次數:
  • 被引用被引用:1
  • 點閱點閱:317
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
  圖書館圖書分類的作業上,長久以來一直近乎以人工作業的方式來完成。近年來由於資料探勘技術已逐步成熟並廣泛地應用各種領域之中,故圖書館界亦開始研究如何將此技術應用於讀者行為的分析、或在讀者服務的提供、或在圖書編目的整理上,卻顯少述及有關圖書分類的作業,在此方面的文獻更是為之貧乏。本研究期望將已為廣泛運用的資料探勘技術應用在圖書分類作業之中,以期能改善圖書分類作業中的一些問題,適而降低圖書館館員的工作負擔。
  本研究將先探討圖書分類系統的作業模式,研究中建構了一個二階段分類的圖書分類系統,第一階段分類者優先模組,運用關聯規則分析的Apriori演算法篩選出可能的圖書分類別,再經過第二階段關鍵字搜尋模組,運用分類分析的Naïve Bayes分類法在這些可能類別中推估最有可能的圖書分類別。最後再以華梵大學圖書館之實際館藏資料來驗證分類系統之可行性及優缺點。實驗結果說明若從電腦輔助分類系統的角度而言,運用資料探勘技術的分類系統可以有效分擔館員分類工作的負擔。
  Book categorization has been a man-made work in library for decades. Since the data mining technology has been advanced and applied to many domains widely, the library researchers also began to leverage this method in offering readers better services, analyzing the reader’s behavior, and cataloguing the books. However, this issue didn’t acquire much attention to study and drill down. In this paper, we applied the data mining technology to book categorization, expect to improve the procedures of book categorization, and reduce the work load of librarian as well.
  This research started from the survey of operational mode in book classifier system, and then create a two-phase analysis model. In the first phase, the Apriori algorithm was applied to count the probability and gain the class with the higher probability, then use the Naïve Bayes classification algorithm to derive the most probability class in the group. Finally, the model was verified by the library of Huafan University, result show that from the assistant viewpoint, the technology of data mining can help the librarian to reduce their working load.
誌 謝 I
摘 要 II
Abstract III
目 錄 IV
表 錄 VI
圖 錄 VIII
一、緒論 1
1.1 研究背景 1
1.2 研究動機與目的 3
1.3 研究範圍與方法 5
1.4 論文章節架構 5
二、文獻探討 6
2.1 圖書分類之簡介 6
2.1.1 圖書分類意義與目的 6
2.1.2 圖書分類的程序 8
2.1.3 圖書分類面臨的挑戰 10
2.1.4 圖書電腦分類的簡介 13
2.1.5 圖書書目與機讀編目格式 17
2.1.6 圖書電腦分類的優點與限制 18
2.2 資料探勘的意義與應用 21
2.2.1 資料探勘的步驟 21
2.2.2 資料探勘技術的類型 22
2.2.2.1 分類分析 22
2.2.2.2 集群分析 22
2.2.2.3 次序相關分析 23
2.2.2.4 關聯規則分析 23
2.2.3 資料探勘於圖書館的應用 24
2.3 資料探勘技術的介紹 26
2.3.1 天真貝氏分類法 26
2.3.2 Apriori演算法 29
三、研究內容與方法 35
3.1 研究對象 35
3.2 研究之理論模型 39
3.3 研究假設與限制 42
3.4 演算法推演分析 43
3.4.1 天真貝氏分類法 44
3.4.2 Apriori演算法 58
四、實驗模擬與結果分析 67
4.1實驗模擬環境 67
4.2資料評估與蒐集 67
4.3成效評估方式 70
4.4實驗重點與測試項目 71
4.4.1 召回率測試與分析 71
4.4.2 準確率測試與分析 74
4.4.3 執行時間測試與分析 79
五、結論 81
5.1 結論 81
5.2 未來發展方向 82
參考文獻 83
[1]卜小蝶,「網路使用者檢索詞彙主題分類探析」,台灣大學圖書資訊學系四十週年系慶研討會,2001年11月16日。
[2] 王省吾,圖書分類法導論,新一版,台北市:中國文化大學出版部,民國六十九年。
[3] 王毓菁,「圖書館閱覽者群組潛在特徵資訊系統」,華梵大學工業管理學系碩士論文,民國九十一年六月。
[4] 王經篤,「中文文件自動分類方法的設計與評估」,國立中正大學資訊工程研究所博士論文,民國九十一年。
[5] 朱惠中、李克強,「應用資料探勘技術於圖書自動分類之研究」, 2005年資訊管理國際研討會,育達管理技術學院,2005年。
[6] 吳安琪,「利用資料探勘的技術及統計的方法增加圖書館的經營與服務」,國立交通大學資訊科學研究所碩士論文,民國九十年六月。
[7] 吳國榮,「階層式類別架構的學習於文件分類之探討研究」,國立中正大學資訊工程研究所碩士論文,民國八十九年。
[8] 林信成、蕭勝文,「模糊詮釋資料及其在圖書館分類編目之應用」,教育資料與圖書館,第四十一期第一卷,第61-76頁,民國九十二年九月。
[9]林鴻儒,「中文文件分類器結合之方法研究」,國立中正大學資訊工程研究所碩士論文,民國八十八年。
[10]孫冠華,「圖書館新書推薦之個人化服務方法」,國立中山大學資訊管理研究所碩士論文,民國八十八年六月。
[11]國立中央圖書館編目組編訂,中文圖書標題表,民國八十二年四月。
[12]國家圖書館,中國圖書分類法增訂七、八版異動類目對照表,台北市:國家圖書館,民國九十一年。
[13]張立樸,「利用貝氏機率模組擷取中文名詞」, 國立中正大學資訊工程研究所碩士論文,民國九十年。
[14]張慧銖,圖書館目錄發展研究,初版,台北:文華圖書,民國九十二年三月。
[15]陳垂呈,「利用關聯規則發掘圖書館個人化之書籍推薦」,圖書資訊學刊,第二卷第二期,第87-103頁,民國九十三年九月。
[16]陳和琴、吳瑠璃、江綉瑛編著,圖書分類編目,初版,台北:國立空中大學,民國八十五年。
[17]陳和琴、張慧銖、陳昭珍、江綉瑛編著,資訊組織,初版,台北:國立空中大學,民國九十二年。
[18]陳亭屹、梁哲豪,「應用資料探勘技術於書籍推薦之研究」,2004台灣網際網路研討會,2004年。
[19]彭于萍,「資料探勘應用於圖書館之探討」,圖書與資訊學刊,第五十期,第76-91頁,民國九十三年八月。
[20]曾元顯,「文件主題自動分類成效因素探討」,中國圖書館學會學報,第六十八期,第62-83頁,民國九十一年六月。
[21]游佳琪,「應用Bayesian Network 於網站自動分類之研究-以台灣網路書店為例」,中國文化大學資訊管理研究所碩士論文,民國九十三年。
[22]黃淑蘭,「電腦輔助中文圖書分類系統設計初探」,中國圖書館學會會報,第五十九期,第65-74頁,民國八十六年。
[23]黃淵泉,中文圖書分類編目學,初版四刷,台北市:台灣學生書局,民國八十二年。
[24]蔡宗翰,「機器分類學習技術於個人化電子郵件助理之研究」,國立台灣大學資訊工程學研究所碩士論文,民國八十七年。
[25]戴汝為,人工智慧,初版一刷,台北:五南圖書,2003年。
[26]顏嘉惠,「資料探勘於圖書館行銷及顧客關係管理之應用」,圖書與資訊學刊,第四十二期,第58-68頁,民國九十一年八月。
[27]魏志平,「資料管理與分析」,電子商務理論與實務,梁定澎主編,華泰文化事業公司,台北市,民國八十九年五月初版,第153-179頁。
[28] R. Agrawal and R. Srikant, “Fast Algorithms for Mining Association Rules in Large Databases”, Proceedings of the 20th International Conference on Very Large Data Bases, pp. 487-499, 1994.
[29]C. Olaru and L. Wehenkel, “Data mining”, IEEE Computer Application in Power, Vol. 12, pp. 19-25, 2000.
[30] Fan-Chen Tseng and Ching-Chi Hsu, “Creating Frequent Patterns with the Frequent Pattern List”, Proceedings of Asia Pacific Conference of Data Mining and Knowledge Discovery, pp. 376-386, Hong Kong, 2001.
[31] Fan-Chen Tseng, Ching-Chi Hsu, H. Chen, “Mining Frequent Closed Itemsets with the Frequent Pattern List”, IEEE International Conference on Data Mining (ICDM’ 01), Hong Kong, 2001.
[32] Hung-Ju Huang and Chun-Nan Hsu, “Bayesian Classification for Data from the Same Unknown Class”, IEEE Transactions on System, Man, and Cybernetics - Part B: Cybernetics, 2000.
[33] Jiawei Han, Jian Pei, and Yiwen Yin, “Mining Frequent Patterns without Candidate Generation”, Proc. 2000 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD' 00), Pages 1-12, Dallas, TX, May 2000.
[34] Jiawei Han and Micheline Kamber, Date Mining: Concepts and Techniques, Morgan Kaufmann, San Francisoc, 2001.
[35] Ming-Syan Chen, Jiawei Han, and Philip S. Yu, “Data Mining: An Overview from a Database Perspective,” IEEE Transactions on Knowledge and Data Engineering, Vol. 8, No. 6, pp. 866-882, Dec 1996.
[36] R. Agrawal, T. Imielinski and A. Swami, “Mining Association Rules between Sets of Items in Large Databases”, Proc. of the 1993 ACM SIGMOD Conference, 1993.
[37]Tian Zhang, Raghu Ramakrishnan, Miron Livny, “BIRCH: an Efficient Data Clustering Method for Very Large Databases”, Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data,
pp. 103-114, 1996.
[38]Tom M. Mitchell, Machine Learning, The McGraw-Hill Companies, Inc. , 1997.
[39]Uros Pompe, Igor Kononenko, “Naïve Bayesian Classifier within ILP-R”, Proceedings of the 5th Internatiobal Workshop on Inductive Logic Programming, Pages 417-436, 1995.
[40] Ken Williams, “Statistics::Contingency - Calculate Precision, Recall, F1, Accuracy, etc.”, http://search.cpan.org/~kwilliams/Statistics-Contingency-0.06/Contingency.pm, 2006-04-01 PM 8:31
[41] Roman Eisner, http://www.cs.ualberta.ca/~eisner/measures.html, 2006-04-04 PM 4:20
[42]Simon Tong, Daphne Koller, “Restricted Bayes Optimal Classifiers ”, Proceedings of the Seventeenth National Conference on Artificial Intelligence, 2000, http://www.aaai.org/Library/AAAI/aaai00contents.php, 2005-11-03 AM 10:20
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔