跳到主要內容

臺灣博碩士論文加值系統

(54.80.249.22) 您好!臺灣時間:2022/01/20 06:56
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:簡光廷
研究生(外文):Kuang-Ting Chien
論文名稱:一個GIDL萃取系統之視覺化工具
論文名稱(外文):A Visualization Tool for GIDL Extraction
指導教授:吳毅成
指導教授(外文):I-Chen Wu
學位類別:碩士
校院名稱:國立交通大學
系所名稱:資訊工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:52
中文關鍵詞:萃取GIDL視覺化
外文關鍵詞:ExtractionGIDLVisualization
相關次數:
  • 被引用被引用:1
  • 點閱點閱:193
  • 評分評分:
  • 下載下載:27
  • 收藏至我的研究室書目清單書目收藏:0
隨著網際網路與電子商務的快速發展,有愈來愈多的人習慣透過網路來獲取自己所要的資訊。可是在這麼廣大且雜亂的資訊中,要萃取出我們想要的資訊並不容易,尤其是那些數量多且變化快的資訊。因此我們需要一套系統可以幫助使用者快速且有系統地萃取出他們想要的資訊。
  一些網頁查詢語言,例如XML-QL、WIDL、GIDL,都協助使用者自動地萃取網頁資料,可是在實際的操作中卻有它們語法上的限制與書寫上的困難。因此本篇論文以GIDL的語法為基礎,提出一套易於使用的視覺化萃取工具,這套工具擁有多種操作模式與萃取功能,可以協助使用者輕易地萃取出他們想要的資訊。有了這套視覺化萃取工具將可以加速網頁資料之萃取並可以降低萃取所需花費的人力與時間成本。
With the rapid growth of Internet and Electronic-Commerce, more and more people need collect information via Internet. But it is not very easy to collect information we want from large amount of data, especially when the data change rapidly. So we need one system to help extract data quickly and systematically.
The Web query languages such as XML-QL, WIDL, GIDL help people collect information from Web server automatically. But there are some limitations in these query languages. In this thesis, we study and develop a user-friendly visualization tool based on GIDL for Web data extraction. There are many kinds of operation model and functionality in this visualization tool. So it can help people collect information they want easily. The visualization tool will facilitate the process of extracting data and reduce the cost of time and manpower.
摘  要 i
ABSTRACT ii
誌 謝 iii
目  錄 iv
表 目 錄 vi
圖 目 錄 vii
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目標 1
1.3 論文大綱 2
第二章 相關研究 3
2.1 常見之網頁資料查詢語言的方法與限制 3
2.1.1 XML-QL 3
2.1.1.1 XML-QL資料萃取的方法 3
2.1.1.2 XML-QL資料萃取的限制 5
2.1.2 WIDL 7
2.1.2.1 WIDL資料萃取的方法 7
2.1.2.2 WIDL資料萃取的限制 10
2.1.3 GIDL 11
2.1.3.1 GIDL資料萃取的方法 11
2.1.3.2 GIDL資料萃取的困難 12
2.2 系統採用之技術規格 13
2.2.1 DOM 13
2.2.2 XPath 14
2.2.2.1文件查詢敘述以XPath表示 14
2.2.2.2軸(Axis) 16
2.2.2.3 述語(Predicates) 19
2.2.3 New Version GIDL 20
第三章 系統架構與功能 26
3.1 系統顯示區域 26
3.1.1網頁資料顯示區 27
3.1.2 DOM Tree 顯示區 27
3.1.3 Service Script 顯示區 27
3.1.4萃取規則顯示區 27
3.2 系統運作流程 28
3.3 系統功能 29
3.3.1 一般操作模式 29
3.3.2 萃取操作模式 30
3.3.3 連結操作模式 32
3.3.4 表單建立模式 33
3.3.5 其他執行功能 34
第四章 系統實作 35
4.1 以Internet Explorer為基礎的網頁瀏覽介面 35
4.2 判斷網頁何時下載完成 36
4.3 DOM Tree 之建立 36
4.4 網頁事件監聽器之製作 38
4.5 將瀏覽結果顯示在指定的視窗中 39
第五章 成果、結論與未來工作 41
5.1 成果與結論 41
5.2 未來工作 42
參考文獻 43
[1] James Clark, Steve DeRose, “XML Path Language (XPath)”, http://www.w3.org/TR/xpath.html, Nov. 1999.
[2] James Clark, “XSL Transformations (XSLT)”, http://www.w3.org/TR/xslt, Nov. 1999.
[3] Steven DeRose, et al., “XML Pointer Language (XPointer)”, http://www.w3.org/TR/xptr/, Sep. 2001.
[4] Alin Deutsch, et al., “XML-QL:A Query Language for XML”, http://www.w3.org/TR/NOTE-xml-ql/, Aug. 1998.
[5] Phillip Merrick, Charles Allen, “Web Interface Definition Language (WIDL)”, http://www.w3.org/TR/NOTE-widl-970922, Sep. 1997.
[6] CGI NCSA HTTPd Development Team, “The Common Gateway Interface (CGI)”, http://hoohoo.ncsa.uiuc.edu/cgi, Jan. 1998.
[7] COM Microsoft Corporation and Digital Equipment Corporation, “The Component Object Model Specification”, Draft Version 0.9, Oct. 1995.
[8] Microsoft, “HOWTO:Determine When a Page Is Done Loading in WebBrowser Control”, http://support.microsoft.com/default.aspx?scid=kb;en-us;Q180366, Feb. 1998.
[9] Microsoft, “HOWTO:Use the WebBrowser Control NewWindow2 Event”, http://support.microsoft.com/default.aspx?scid=kb;EN-US;q184876, Apr. 1998.
[10] W3C, “Document Object Model (DOM)”, http://www.w3c.org/DOM/.
[11] W3C, “Extensible Markup Language (XML)”, http://www.w3c.org/XML/, Feb. 1998.
[12] W3C, “Hyper Text Markup Language”, http://www.w3c.org/Markup/, Jan. 1998.
[13] MSDN Library, “Reusing the WebBrowser Control”, http://msdn.microsoft.com/library/default.asp?url=/workshop/browser/webbrowser/webbrowser.asp.
[14] J.C. Chen, “General Interface Definition Language For Web Extraction”, National Chiao Tung University, M.S. Thesis, Jun. 2001.
[15] Mark Davis, “Add Internet Browsing to Your MFC Application with the Microsoft Internet Explorer Control”, Visual C++ Developer, Feb. 1997.
[16] J.Y. Huang, “A GUI Based Environment For Web Data Extraction”, National Chiao Tung University, M.S. Thesis, Jun. 2001.
[17] Scott Roberts, “Keeping an Eye on Your Browser by Monitoring Internet Explorer 4.0 Events”, Microsoft System Journal, Jun. 1998.
[18] Mark G. Wales, “WIDL:Interface Definition for the Web”, IEEE Internet Computing, Vol. 3, No. 1, pp. 55-59, Jan. 1999.
[19] Michael Wallent, “An Introduction to the Dynamic HTML Object Model”,Microsoft Corporation, Apr. 1997.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top