跳到主要內容

臺灣博碩士論文加值系統

(35.172.223.251) 您好!臺灣時間:2022/08/17 01:17
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蔡德男
研究生(外文):Tsai Tiah-nan
論文名稱:建置XML為基之資料倉儲資料轉換閘
論文名稱(外文):An XML-Based Data Gateway in Data Warehouse
指導教授:郭木興郭木興引用關係
學位類別:碩士
校院名稱:國防管理學院
系所名稱:國防資訊研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:79
中文關鍵詞:資料倉儲可延伸式標注語言電子商務
外文關鍵詞:Data WarehouseeXtensible Markup LanguageXMLXML Schema
相關次數:
  • 被引用被引用:3
  • 點閱點閱:240
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
企業欲引用資料倉儲(Data Warehouse)技術來支援決策制定,必需從多個具分散性、自主性與異質性的資料來源,透過篩選、驗證、轉換等工作來建立一個全企業(Enterprise-wide)的長期性整合資料儲存環境。面對這些分散、自主與異質的資料來源,最大的困難即是必需依據這些異質平台資料庫的特性選擇不同的資料庫轉換工具,進行資料摘取(Extraction)、資料修補(Scrubbing)、格式轉換(Translation)等工作後,再將資料匯入資料倉儲系統中,這些工作不但大幅增加了資料倉儲系統建置的困難與人力和時間的耗費,同時異質資料庫間也難以直接進行資料分享與交換。
另由於SGML過於複雜難學及HTML語這缺乏結構等因素,使得XML已漸成為網際網路的主要語言與資料交換的標準,但企業組織在面對早已建置多年且資料龐大的資料庫卻沒有一個簡單、方便、快速及適合企業需求的XML文件轉換機制。
基於前述各項問題,本研究運用可延伸式標注語言(eXtensible Markup Language; XML)具異質系統間的資訊互通、結構性資料及跨平台等能力,提出一種以XML為基之資料倉儲資料轉換閘(XML-Based Database Gateway),期做為分散異質資料庫與資料倉儲系統之資料交換與資料驗證機制外,並可提供企業對早已建置多年且數量龐大的傳統資料庫資料與XML文件間的轉換機制。另針對XML文件驗證機制部份,由於Document Type Definition(DTD)不若XML Schema完整,因此本研究捨棄目前大多數研究論文所採用的DTD驗證機制,改以XML Schema,使本研究模型運用於異質資料交換時更加完善。
本研究提出之資料倉儲資料轉換閘中共設計有六個子模組:「User Interface」:提供高親和力的使用者管理介面,讓使用者透過點選方式,即能輕易完成資料轉換及管理的工作;「Data Access Submodule」:負責與各分散異質資料庫進行溝通、路徑建立及資料內容、型態、欄位長度等存取作業;「Data Identification Module」:用來定義各分散異質資料庫與資料倉儲系統中資料之關聯性,包括資料之屬性、型態及對應規則,以做為資料轉換、查詢、管理與交換之依據;「Transformation Module」:負責將資料庫資料轉譯為XML文件格式及對XML文件進行解析後,反轉譯為資料倉儲庫資料格式;「Data Schema Module」:負責自Data Identification Module 接收各資料規則後,產生、儲存及管理XML Schema,以做為XML文件資料驗證之依據;「Data Retrieve Submodule」:負責將反轉譯成資料倉儲庫資料格式之XML文件資料存入倉儲資料庫中。
最後針對本研究模型進行實作,以驗證XML除可做為建立自動化資料轉換及驗證機制,減少資料轉換與驗證工作的複雜與困難,提高資料倉儲建置的率效,以支援組織決策制定,提昇企業競爭力外,並可解決企業面對早已建置多年且資料龐大的傳統資料庫與XML文件轉換的問題,使得企業在商務電子化及以XML文件為資料交換標準的電子商務時代,能順利及迅速地與世界接軌。
In the fast-changing information market, business organizations intend to utilize the technology of Data Warehousing to support their marketing analysis and decision-makings from distributed, independent, and heterogeneous data resources after performing processes like filtering, verifying, and translating data, and then develop an environment that is suitable for being the entire business’ long-term integrated data storage. One of the biggest challenges of handling data from various distributed heterogeneous resources is to import data into a Data Warehouse System by choosing an appropriate tool to perform processes like data extraction, data scrubbing, data translation, and data format transformation according to the characteristics of heterogeneous databases. Due to the high demand of manpower and time, these processes significantly increase the difficulty of establishing a Data Warehouse System. Even though extensible Markup Language, abbreviated as XML, has become the main language and data exchange standard for the World Wide Web, abbreviated as WWW, there is no such a simple, efficient, convenient, and suitable document translation mechanism available for business organization to use while facing their huge and long-established heterogeneous organization databases. This situation becomes a barrier for doing data exchange among business organizations and limits their future development.
This research applies XML, which possesses the capability of intra-communication among heterogeneous systems in a business organization, building structural data format, interoperable across platforms, and verifying the validity of data, to establish an XML-Based Data Gateway. This gateway is the data exchange and automatic verification mechanism between heterogeneous databases and the Data Warehouse. It also plays the role of being the transformation mechanism for business organizations to perform XML document translation for data in their long-established large-volume databases. Besides mentioned above, cause of the abundant data types, supporting namespace, easy to understand, excellent flexibility, we further our research on using XML schema to replace DTD, most of researches adopted currently, as the XML document verification standard to create a better system model.
There are six sub modules in our XML-Based Data gateway: User Interface, which is a user-friendly user management interface to allow a user to easily achieve data translation and data management by simple clicks; Data Access Submodule is in charge of the communication among the different database and the accesses of data contents, types, and field length; Data Identification Module, which is used to define the relationship between the distributed heterogeneous database and Data Warehouse System, including data attributes, types and corresponding rules that will be used as the basis for data translation, query, management and exchange; Transformation Module is in charge of translating the data of a database into an XML document and reverse-translating XML document into the database format of the Data Warehouse followed with syntactic analysis; Data Schema Module, which accepts every data rules from Data Identification Module, then creates, stores and manages XML schema as the basis for XML data document verification; Data Retrieve Submodule, which stores the reverse-translated data into the database of the Data Warehouse.
At last, we implement a Prototype system based on the models designed to prove that the XML-Based Data Gateway is workable and suitable in Data Warehouse.
1 緒論 1
2 文獻探討 8
2.1 資料倉儲(Data Warehouse) 8
2.1.1 資料倉儲的定義與架構 8
2.1.2 資料倉儲與資料庫之差異 13
2.2 可延伸式標注語言(eXtensible Markup Language; XML) 22
2.2.1 XML的發展 22
2.2.2 XML的特色 26
2.2.3 XML的優勢 28
3 以XML為基之資料倉儲資料轉換閘資訊模型 31
3.1 XML相關技術之探討 31
3.2 XML為基之資料倉儲資料轉換閘系統模型架構 42
3.3 資訊模型設計 45
4 系統雛型實作與測試 49
4.1 系統開發環境 49
4.1.1 SQL Server 2000 49
4.1.2 Delphi 50
4.1.3 XML DOM 51
4.2 系統雛型設計 51
4.3 系統測試 60
5 結論與後續研究方向 63
6 參考文獻 66
中文部分
[1] 周清江、林修杰、邱奕儒(民八七‧十一月‧九日至十一日),「網路資料庫之自動化交換雛型系統」,1998年台灣地區網際網路研討會(TANET’98)。
[2] 鍾孟宇(民八八‧六月),「企業建立資料倉儲架構之研究」,國立中央大學資訊管理研究所碩士論文。
[3] 簡基元(民八八‧六月),「整合資訊倉儲建構以工作為導向之企業資訊服務系統」,國立交通大學資訊管理研究所碩士論文。
[4] Simon St. Laurent原著 余顯強譯(民八九),「XML理論與實作導引」,博碩文化股份有限公司。
[5] 徐武駿(民八九‧六月),「XML-Based開放性MetaData交換機制之設計與實作:應用於商業智慧系統」,國立屏東科技大學碩士論文。
[6] 黃中杰、王天利(民八九‧十二月),「XML新網頁語言開發手冊」,知城數立。
[7] 郭木興、蔡德男(民九十),“資料倉儲技術於犯罪資料分析應用之研究”,第五屆資訊管理學術暨警政資訊時務研討會,頁196-202。
[8] 沈兆陽、李勁(民九十‧一月),「SQL Server 2000 與XML整合應用」,文魁資訊股份有限公司。
[9] 沈兆陽(民九十‧二月),「SQL Server 2000 OLAP解決方案」,文魁資訊股份有限公司。
[10] 邱人鈿等(民九十‧四月),「洞悉XML」,網碩資訊編著。
[11] 郭木興(民九十‧十二月),「電子商務理論與技術」,基峰資訊。
[12] 陳會安(民九一‧一月),「XML網頁製作徹底研究」,旗標出版股份有限公司。
英文部份
[13] Andreas Kurz and A Min Tjoa [1997], “Data Warehouse within Intranet:Prototype of a Web-based Executive Information System” IEEE,.
[14] Extensible Stylesheet Language : XSL Version 1.0, Amazon.com, [1999].
[15] Frank Ravat、Olivier Teste、Gilles Zurfluh [1999], ”Toward Data Warehouse Design”, communication of the ACM.
[16] Hoven, J. V. D [1999. Spring], “Data Warehousing:Bring It All Together”, Information System Management, pp. 92-95.
[17] Jixue Lin and Millist Vincent [1998], “An architecture for data warehouse systems” IEEE.
[18] Matteo Golfarelli, Stefano Rizzi [1999], ”A Methodological Framework for Data Warehouse Design”, communication of the ACM .
[19] Michael Boehnlein and Achim Ulbrich-vom Ende [1999], “Deriving initial data warehouse structure from conecptual data models of the Underlying Operational Information Systems”, Communications of the ACM.
[20] Murtaza A., [1998. Fall], “A Framework for Developing Enterprise Data Warehouse” Information System Management, pp. 21-26.
[21] Neil Bradley, The XSL Companion, Amazon.com, [2000].
[22] Remzi Kirkgoze, Nevena Latic, Mladen Stolba, A Min Tjoa [1997], “A Security Concept for OLAP”, IEEE.
[23] Sen, A. and V. Jacob [1998], “Industrial-strength Data Warehousing, Association for Computing Machinery.“ Communications of the ACM, Vol. 41, Iss. 9, pp. 28-31.
[24] Shi-Ming Huang、Irene Kwan、David C. Yen、Shang-Yuen Hsueh [2000], ”Developing an XML Gateway for Business-to-Business Commerce”, IEEE.
[25] Stephen R. Gardner [1998.9], “Building the Data Warehouse”, Communication of the ACM, Vol. 41, No.9.
[26] W. H. Inmon [1992], “Building the Data Warehouse”, second edition, Wiley Computer Publishing2.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top