(3.239.192.241) 您好!臺灣時間:2021/03/02 13:45
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:賴銘祥
論文名稱:以群集演算法輔助決定綱要間的屬性相關性
論文名稱(外文):Aiding interschema attribute correspondence determination by using clustering algorithms
指導教授:陳響亮陳響亮引用關係黃河銓黃河銓引用關係
學位類別:碩士
校院名稱:國立成功大學
系所名稱:製造工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
中文關鍵詞:異質性資料庫屬性相關性
相關次數:
  • 被引用被引用:0
  • 點閱點閱:772
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
在異質性資料庫的三種主要的資料庫整合架構中,確認屬性間的相似性是在系統能回答查詢前的基礎步驟。一家大型企業可能會在大型主機上建立一個包含幾兆位元組(tera-bytes)的超大型資料庫,以便能提供適當的決策資訊。若以人工的方式來一一比對所有可能的屬性相似對,將是一項不智的舉動。有鑑於此,針對確認屬性的相關性,Li提出了一個使用類神經網路為模式辨認工具的比對模式,並成功的將其發展成一個半自動的輔助工具。然而其模式係於西元1994提出,又由於近來軟體技術與資料庫技術的進步,現今的資料庫產品莫不以支持大型的物件(LOB)為第一要務,因此實有必要對其模式作更新的工作,再加上更於重新檢視其模式時發現了諸多關於變項的選擇上的問題,尤其若以統計的角度來解釋其在變項的使用上,更可發現一些不盡合理之處。本研究即針對Li的研究的缺失提出一更為合理的、可靠的的比較模式,並調適了既有的研究使得亦適用於新的資料庫技術支援大型物件(Large OBjects, LOB)的特性。
目錄
摘要 1
Abstract 3
誌謝 4
目錄 5
表目錄 8
圖目錄 11
第一章 緒論 12
1.1 背景介紹 12
1.1.1 異質性資料庫系統 12
1.1.2 為何需要建構異質性資料庫系統 13
1.2 研究動機與目的 14
1.3 論文大綱 16
第二章 相關研究 18
2.1 異質性 18
2.2 語意衝突的分類 19
2.3 相關的綱要整合方法 23
2.3.1 回顧Li的方法 26
2.3.2 屬性相等理論 32
第三章 群集演算法理論分析 34
3.1 群集分析(clustering analysis) 34
3.1.1 群集分析法 34
3.1.2 類神經網路群集分析 36
3.1.2.1 自組織特徵映射圖 36
3.2 相似性量測 38
第四章 研究方法 41
4.1 從資料庫系統擷取中介資料 41
4.2 準備輸入資料 42
4.2.1 輸入變數的選擇 42
4.2.2 資料標準化 47
4.2.2.1 調整資料使得每一個項目的值在0與1之間的理由 47
4.2.2.2 資料標準化的方法 47
4.3 綱要資訊 (schema information/field specification) 49
4.3.1 資料型態 49
4.3.1.1 綱要資訊裡的資料長度、資料精確度和小數位數 55
4.3.2 序列資料 56
4.3.3 欄位限制 57
4.4 資料內容統計量 (Data content statistics) 59
4.4.1 資料抽樣 59
4.4.1.1 簡單隨機抽樣 59
4.4.2 表示樣本特徵的量數 60
4.4.3 資料內容的處理方式 66
4.5 結語 68
4.5.1 各資料型態的處理方式 68
4.5.2 本研究與Li的方法的異同 70
第五章 個案研究 72
5.1 概述 72
5.2 相關工具軟體 77
5.2.1 使用的Excel函數 77
5.2.2 群集工具軟體 78
5.3 資料庫屬性比對試驗 80
5.3.1 試驗結果 91
5.3.2 效能衡量 113
5.4 結語 117
第六章 結論與建議 118
6.1 結論 118
6.2 未來研究方向 118
參考文獻 125
參考文獻
1. 曾守正,資料庫系統之理論與實務,儒林圖書,1997。
2. 謝明宏 譯,SAP革命,迪茂國際,2000。
3. W. Litwin, A. Abdellatif, A. Zeroual, B. Nicolas, Ph. Vigier, 1989, “MSQL: A Multidatabase Language,” Information Sciences, Vol. 49, pp. 59-101.
4. W.S. Li, C. Clifton, 2000, “SEMINT: A tool for identifying attribute correspondences in heterogeneous databases using neural networks, ” Data & Knowledge Engineering, Vol. 33, pp. 49-84.
5. A. Sheth, V. Kashyap, November 1992, So far (schematically) yet so near (semantically), in: Proceedings of the IFIP TC2/WG2.6 Conference on Semantics of Interoperable Database Systems, Victoria, Australia.
6. V. Ventrone, S. Heiler, August 1994, Some advice for dealing with semantic heterogeneity in federated database systems, in: Proceedings of the Database Colloquium, San Diego, Armed Forces Communications and Electronics Assc. (AFCEA).
7. W.S. Li, C. Clifton, 1995, Semint: a system prototype for semantic integration in heterogeneors databases(demonstration description).in: Proceedings of the 1995 ACM SIGMOD Conference, San Jose, California.
8. W.S. Li, C. Clifton, S.Y. Liu, 2000, Database integration using neural network: inplementation and experiences, Knowledge and Information Systems 2: 73-96.
9. W.S. Li, C. Clifton, S.Y. Liu, 2000, Database integration using neural network: inplementation and experiences, Knowledge and Information Systems 2: 73-96.
10. 蔡政隆,1993,“解決多資料環境資料差異之研究”,國立成功大學資訊工程研究所碩士論文.
11. W. Kim, J. Seo, 1991, “classifying schematic and data heterogeneity in multidatabase systems, “ IEEE Computer, pp 12-18.
12. C. Lee, C. -J. Chen, H. Lu, 1995, “An aspect of query optimation in multidatabase Systems,” ACM SIGMOD Record, Vol. 24, No. 3, pp. 28-33.
13. 劉玉枝,1994,“一個半自動的多資料庫系統綱要整合方法”,台灣工業技術學院工程技術研究所電子工程技術學程碩士學位論文.
14. 陳明賢,1999,“以虛擬全域綱要輔助整合既存的資料庫綱要”,私立大同大學資訊工程研究所碩士學位論文.
15. 陳明毅,1999,“適用於資料倉儲的資料庫綱目整合方法”,私立大同工學院資訊工程研究所碩士學位論文.
16. C. Batini, M. Lenzerini, and S. B. Navathe, Dec 1986, “A Comparative Analysis of Methodologies for Database Schema Integration,” ACM Computing Surveys, Vol. 18, No. 4, pp. 323-364.
17. 柯佳伶,1993,“異質物件式綱目的整合”,國立清華大學資訊科學研究所碩士論文.
18. W. Gotthard, P. C. Lockemann, A. Neufeld, Feb. 1992, “System-guided view integration for object-oriented databases,” IEEE Transactions on Knowledge and Data Engineering, Vol. 4, No.1, pp. 1-22.
19. G. A. Miller, WordNet: A Lexical Databases for English, Commun., ACM, New York, November 1995, pp. 39-41.
20. S. Navathe, P. Buneman, 1986, “Integrating user views in database design,” Computer 19(1), pp. 50-62.
21. J. A. Larson, S. B. Navathe, and R. Elmasri, Apr. 1989 “A theory of attribute equivalence in databases with application to schema integration,” IEEE Transactions on Software Engineering, Vol. 15, No. 4, pp.449-463.
22. A. P. Sheth, and J. A. Larson, 1990, “Federated database systems for managing distributed, heterogeneous, and autonomous databases,” ACM Computing Surveys, Vol. 22, No. 3, pp.183-236.
23. 黃俊英,多變量分析,中國經濟企業研究所,2001。
24. 林昇甫、洪成安,神經網路入門與圖樣辨識,全華科技圖書,1993。
25. 蘇木春、張孝德,機器學習:類神經網路、模糊系統以及基因演算法則,全華科技圖書,2000。
26. T. Kohonen, 1990, “The self-organizing map,” Proc. IEEE, Vol. 78, No. 9, pp. 1464-1480.
27. T. Kohonen, 1988, “Statistical pattern recognition with neural network: benchmark studies,” ICNN-88, 1.
28. T. Kohonen, 1988, “An introduction to neural computing,” Neural Networks, 1(1),
3-16.
29. T. Kohonen, 1982, “Self-Organized Formation of Topologically Correct Feature
Maps,” Biological Cybernetics, 43, 59-69.
30. T. Kohonen, 1988, Self-Organization and Associative Memory, 2nd ed., New
York: Springer-Verlag.
31. A. D. Gordon, 1999, Classification, Chapman & Hall/CRC
32. 彭文正 譯,資料採礦顧客關係管理暨電子行銷之應用,數博網資訊,2001。
33. 葉怡成,類神經網路模式應用與實作,儒林圖書,2000。
34. S. S. Stevens, 1946, “On the theory of scales of measurement,” Science, 103, 667-680.
35. 王文中,統計學與Excel資料分析之實習應用,博碩文化, 1999。
36. J. Michell, 1994, the relevance of the classical theory of measurement to modern psychology. In M. Wilson (Ed.), Objective measurement: Theory into practice. Vol. 2, Norwood, NJ: Ablex.
37. 謝崇耀 譯,Oracle資料庫設計,美商歐萊禮,2000。
38. http://www.oracle.com/
39. 丁世杰、鄭曉強 譯,SQL應用聖經,美商愛迪生維斯理、和碩科技文化,1997。
40. 吳旭志、賴淑貞 譯,資料採礦理論與實務,維科圖書,2001。
41. 李卓偉,統計學(上),巨德,1993。
42. 林惠玲、陳正倉,統計學方法與應用(上冊),雙葉書廊,1996。
43. J. W. Tukey, 1977, Exploratory Data Analysis, Addison-Wesley.
44. 林宏諭、林建宏、熊漢琳,Excel 2002完整學習應用大全,博碩文化,2001。
45. http://www.sas.com/
46. http://www.spss.com/
47. 彭昭英,SAS與統計分析,儒林圖書,2001。
48. M. A. Wong, C. Schaack, 1982, “Using the Kth nearest neighbor clustering procedure to determine the number of subpopulations,” American Statistical Association 1982 Proceedings of the Statistical Computing Section, pp. 40-48.
49. 張紹勳、張紹評、林秀娟,SPSS For Windows多變量統計分析,松崗電腦圖書資料,2001。
50. 陳正昌、程炳林,SPSS、SAS、BMDP統計軟體在多變量分析上的應用,五南圖書,1994。
51. J. F. Hair, JR., R. E. Anderson, R. L. Tatham, W. C. Black, 1998, Multivariate data analysis, Prentice-Hall.
52. J. Han, M. Kamber, 2001, Data Mining: Concepts and Techniques, Academic Press.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊
 
系統版面圖檔 系統版面圖檔