跳到主要內容

臺灣博碩士論文加值系統

(34.204.169.230) 您好!臺灣時間:2024/02/26 12:51
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:胡家琳
研究生(外文):Chia-Lin Hu
論文名稱:以文字探勘技術之電子檔案語意網路初探
論文名稱(外文):Exploring the Semantic Network of Electronic Records with Text Mining Technology
指導教授:許芳銘許芳銘引用關係
指導教授(外文):Fang-Ming Hsu
學位類別:碩士
校院名稱:國立東華大學
系所名稱:資訊管理碩士學位學程
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2014
畢業學年度:102
論文頁數:128
中文關鍵詞:電子檔案知識本體文字探勘關聯規則語意網路
外文關鍵詞:Electronic RecordsOntologyText MiningAssociation RuleSemantic Network
相關次數:
  • 被引用被引用:0
  • 點閱點閱:464
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
隨著資訊科技迅速發展與電腦普及化的影響,檔案逐漸由紙本轉為電子化形式,電子檔案的數量越來越多,各國對逐漸重視電子檔案,而國內外電子檔案管理之發展日漸成熟,我國政府積極地推動電子檔案管理制度,電子檔案在學術和實務上引發許多的討論。然而,目前電子檔案領域中,還未建立一個供專家學者參考的知識本體,且過去研究鮮少基於文件分析之本體設計方法,整合應用於電子檔案之知識領域上,因此本研究以「電子檔案」為研究對象,以知識本體為基礎,建立電子檔案領域之語意網路。
首先蒐集2004年至2013年電子檔案相關研究文獻,利用文字探勘技術,建立領域詞彙表和詞彙索引表,經過資料清理,去除與領域不相關的詞彙,找出領域詞彙,再使用關聯規則演算法,計算兩兩詞彙之間的相關性,以網路形式呈現,形成語意網路。
With the rapid development of information technologies and computerization, many records in organizations are transferred from paper to electronic format. Electronic records (ER) are growing in last decades and trigger many discussions in academic and practical area. In Taiwan, electronic records management has been deployed in government agencies for long-term preservation. However, there still lacks an ontology as a reference and few studies are based on the method of ontology learning in ER discipline. Therefore, this paper aims to use ontology approach to explore the semantic network from ER literatures.
First, we collected the articles regarding electronic records from 2004 to 2013, filtered the meaningful words with high frequency, and furthermore organized them into intellectual framework. After these procedures, we can find the relation of words, phrases and semantic network in the field of electronic records.
目錄

第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究問題與目的 3
第二章 文獻探討 5
第一節 知識本體 5
第二節 本體學習 6
第三節 文字探勘 9
第四節 關聯規則 11
第五節 語意網路 13
第六節 Google學術搜尋 15
第三章 研究方法 17
第一節 資料蒐集 19
第二節 建立詞彙表與索引表 20
第三節 資料清理 20
第四節 語意網路建構 21
第五節 語意結構分析 21
第四章 實驗結果與分析 23
第一節 資料蒐集 23
第二節 建立詞彙表與詞彙索引表 23
第三節 資料清理 24
第四節 語意網路建構 30
第五節 語意結構分析 32
伍、結論與建議 57
第一節 結論 57
第二節 未來研究 58
第三節 研究限制 59
參考文獻 60
附錄 65
附錄一、ER之電子檔案文獻 65
附錄二、DA之電子檔案文獻 86
附錄三、ER之詞彙來源 115
附錄四、DA之詞彙來源 118
附錄五、ER之電子檔案常見詞彙表 122
附錄六、DA之電子檔案常見詞彙表 125



表目錄

表2. 1 知識本體建置的應用研究類之研究 7
表2. 2 知識本體建置的方法改善類之研究 8
表3. 1 本研究方法簡述及對應AGOE方法 18
表4. 1 合併詞彙 25
表4. 2 統一使用的詞彙 26
表4. 3 ER之詞彙來源(部分) 26
表4. 4 DA之詞彙來源(部分) 27
表4. 5 ER之電子檔案常見詞彙表(部分) 28
表4. 6 DA之電子檔案常見詞彙表(部分) 28
表4. 7 ER之電子檔案常見詞彙索引表(部分) 29
表4. 8 DA之電子檔案常見詞彙索引表(部分) 30
表4. 9 ER之分群結果 33
表4. 10 DA之分群結果 35
表4. 11 ER和DA詞彙之篇數比較)(前20名) 48
表4. 12 ER和DA詞彙之頻率比較(前20名) 51
表4. 13 ER詞彙之篇數和頻率排名比較(前20名) 52
表4. 14 DA詞彙之篇數和頻率排名比較(前20名) 52



圖目錄

圖3. 1 研究流程 17
圖4. 1 ER之語意網路(關聯程度≧40) 31
圖4. 2 DA之語意網路(關聯程度≧40) 32
圖4. 3 ER之樹狀圖 33
圖4. 4 DA之樹狀圖 33
圖4. 5 ER之多元尺度方法 37
圖4. 6 ER之多元尺度方法(ER_G1 & ER_G2) 38
圖4. 7 ER之多元尺度方法(ER_G3 & ER_G4) 39
圖4. 8 ER之多元尺度方法(ER_G5 & ER_G6) 40
圖4. 9 DA之多元尺度方法 41
圖4. 10 DA之多元尺度方法(DA_G1 & DA_G2) 42
圖4. 11 DA之多元尺度方法(DA_G3 & DA_G4) 43
圖4. 12 DA之多元尺度方法(DA_G5 & DA_G6) 44
圖4. 13 ER詞彙之出現篇數(前20名) 46
圖4. 14 DA詞彙之出現篇數(前20名) 47
圖4. 15 ER詞彙之頻率(前20名) 49
圖4. 16 DA詞彙之頻率(前20名) 50
圖4. 17 ER詞彙平均出現次數(部分) 53
圖4. 18 DA詞彙平均出現次數(部分) 54
網路資料

1. 湖北大學檔案學,電子文件管理術語表,2011,網址:http://lswh.hubu.edu.cn/erm/file/syb.pdf。
2. 加拿大國家圖書暨檔案館,A-Z Index,2014,網址:http://www.bac-lac.gc.ca/eng/discover/Pages/a-z-index.aspx。
3. 美國國家檔案館,A-Z Index,2014,網址:http://www.archives.gov/global-pages/subject-index.html。
4. 澳洲國家檔案館,Glossary,2014,網址:http://www.naa.gov.au/records-management/publications/glossary.aspx。
5. 澳洲國家檔案館,Australian Governments' Interactive Functions Thesaurus,2014,網址:http://www.naa.gov.au/records-management/publications/agift.aspx。
6. 國家發展委員會檔案管理局,電子檔案線上百科,2014,網址:http://wiki.archives.gov.tw/。
7. Google,Google學術搜尋,204,網址:http://scholar.google.com/intl/en/scholar/about.html。
8. SQL Server,TFIDF公式,取自2014年「詞彙擷取轉換編輯器 (進階索引標籤)」,網址:http://technet.microsoft.com/zh-tw/library/ms187700(v=sql.110).aspx。



中文文獻

1. 吳欣達(2006),利用文件探勘技術找尋疾病關連基因。國立陽明大學生物資訊研究所碩士論文。
2. 邱登裕、潘雅真(2006),結合資訊檢索與分群演算法建構知識地圖。資訊管理學報,第十三卷.第S期137~160頁。
3. 侯建良、楊綠淵(2004),以文件關聯性為基礎之企業知識客服管理模式。資訊管理學報,第十一卷.第四期:205~228頁。
4. 許中川、陳景揆(2001),探勘中文新聞文件。資訊管理學報,第七卷.第二期:103~122頁。
5. 戚玉樑、蔡明宏(2007),以文件為對象的概念萃取程序建立知識本體的雛型架構。資訊管理學報,14(3),47-66。
6. 陳良駒,陳日鑫(2009),以關聯規則與共詞分析探討軍事新聞文件群集效果。第20屆國際資訊管理學術研討會,中華民國資訊管理學會主辦。
7. 周濟群、戚玉樑、曾建勛(2012),以詞彙表為基礎的知識本體雛型建構研究-以「公司治理」領域知識為例。圖書資訊學研究,vol.6,p.37-81。



英文文獻

1. Aussenac-Gilles, N., Biébow, B., & Szulman, S. (2000, October). Revisiting ontology design: A method based on corpus analysis. Paper presented at the 12th International Conference on Knowledge Engineering and Knowledge Management, Juan-les-Pins, France.
2. Chen, H., (2001). Knowledge Management Systems: A Text Mining Perspective, Tucson: Knowledge Computing Corporation.
3. Chi, Y.-L. (2007). Elicitation synergy of extracting conceptual tags and hierarchies in textual document. Expert Systems with Applications, 32, 349-357.
4. Church, K. W., & Hanks, P. (1990). Word association norms, mutual information, and lexicography. Computational Linguistics, 16, 22-29.
5. Cimiano, P. (2006). Ontology learning and population from text: Algorithms, evaluation and applications. New York: Springer.
6. Daconta, M. C., Obrst, L. J., & Smith, K. T. (2003) The Semantic Web: A Guide to the Future of XML, Web Services and Knowledge Management, Wiley.
7. Ding, Y. (2001) Ontology: The enabler for the Semantic Web, Journal of Information Science, (27:6), pp. 377-384.
8. Downey, D., Etzioni, O., Soderland, S., & Weld, D. S. (2004, July). Learning text patterns for web information extraction and assessment. the American Association for Artificial Intelligence Workshop on Adaptive Text Extraction and Mining, San Jose, CA.
9. G. Salton, (1989). Automatic Text processing : The Transformation, Analysis, and Retrieval of Information by Compute. Addison Wesley.
10. Gomez-Perez, A .(1999). Ontological engineering: A state of the art. Expert Update, 2(3), 33-43.
11. Gruber, T. R.(1993). A translation approach to portable ontology specification. Knowledge Acquisition, 5, 199-220.
12. Gruber, T. R.(1995). Towards principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies, 43(5-6), 907-928.
13. Hadzic, M., Wongthongtham, P., Dillon, T., & Chang, E.(2009). Ontology-Based Multi-Agent Systems. Studies in Computational Intelligence, V. 219, Berlin: Springer.
14. Hamon, T., & Nazarenko, A. (2001). Detection of synonymy links between terms: Experiment and results. In D. Bourigault, C. Jacquemin, & M.- C. L’Homme (Eds.), Recent advances in computational terminology (pp. 185-208). Amsterdam: John Benjamins.
15. Hindle, D. (1990, June). Noun classification from predicate-argument structures. the 28th annual meeting on Association for Computational Linguistics, Pittsburgh, PA.
16. Horrocks, I., Patel-Schneider, P. F., & Harmelen, F. V. (2003) From SHIQ and RDF to OWL: The Making of a Web Ontology Language. Journal of Web Semantics, (1:1), pp. 7-26.
17. Kim, H. & Lee, J. Y., (2008). Exploring the Emerging Intellectual Structure of Archival Studies Using Text Mining: 2001-2004. Journal of Information Science, 34(3), 356-369.
18. Lee, C. T., Huang, I., & Fang, K. T. (2010, July). A study of building tax knowledge-based system: An ontological orientation -- Using cases under the national tax administration of central Taiwan province, ministry of finance. Technology Management for Global Economic Growth, Phuket, Thailand.
19. Lin, D. (1998, August). Automatic retrieval and clustering of similar words. the 17th International Conference on Computational Linguistics, Quebec, Canada.
20. Liu, P., Hu, Y., Wang, X., & Liu, K. (2011, May). A methodology for domain ontology construction in information science. International Conference on E-Business and E-Government, Shanghai, China.
21. Maedche, A., & Staab, S. (2001). Ontology learning for the semantic web. IEEE Intelligent Systems, 16(2), 72-79.
22. Morgan, A., Hirschman, L., Yeh, A., & Colosimo, M. (2003, July). Gene name extraction using FlyBase resources. the ACL Workshop on Natural Language Processing in Biomedicine, Sapporo, Japan.
23. Noy, N. F. & McGuinness, D. L. (2010) Ontology Development 101: A Guide to Creating Your First Ontology. Stanford Knowledge Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880.
24. Rajsiri, V., Lorré, J.-P., Bénaben, F., & Pingaud, H. (2010). Knowledge-based system for collaborative process specification. Computers in Industry, 61, 161-175.
25. Ruckhaus, E. & Vidal, M. E. (2003) XWebSOGO: An Ontology Language to Describe and Query Web Sources. Workshop On Web Information And Data Management, pp.62-65.
26. Sanderson, M., & Croft, B. (1999, August). Deriving concept hierarchies from text. the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Berkeley, CA.
27. Sowa, J. F. (1992). Semantic Networks. In Encyclopedia of Artificial Intelligence. New York, NY: John Willy & Sons.
28. Sullivan, D. (2001). Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing and Sales (1st ed.). New York: John Wiley & Son, Inc.
29. Tang, S., & Cai, Z. (2010, July). Tourism domain ontology construction from the unstructured text documents. the 9th IEEE International Conference on Cognitive Informatics, Beijing, China.

電子全文 電子全文(本篇電子全文限研究生所屬學校校內系統及IP範圍內開放)
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top