(3.236.214.19) 您好!臺灣時間:2021/05/10 08:11
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

: 
twitterline
研究生:吳政儀
研究生(外文):Zheng-Yi Wu
論文名稱:支援具有複雜關鍵字限制之XML查詢系統
論文名稱(外文):Supporting XML Query Processing with Complex Keyword Constraints
指導教授:張雅惠張雅惠引用關係
指導教授(外文):Ya-Hui Chang
學位類別:碩士
校院名稱:國立臺灣海洋大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:67
中文關鍵詞:關鍵字資訊檢索查詢句
外文關鍵詞:keywordIRXQuery
相關次數:
  • 被引用被引用:1
  • 點閱點閱:139
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:25
  • 收藏至我的研究室書目清單書目收藏:1
在本論文中,我們探討如何在XQuery查詢處理演算法中,加入資訊檢索之技術,進而從大量的XML文件中找出符合使用者查詢句結構化和關鍵字限制之資料。
本論文查詢處理的範圍包含對XML元素結構限制的處理,以及對關鍵字距離和順序限制的處理。本論文提出兩種作法,並評估其效益。第一種TJ_IR方法是將使用者輸入之查詢句結構建立成查詢樹,根據該查詢樹抓取符合節點的元素,接著處理關鍵字限制,再將符合的結果利用TJFast [LLCC05] 合併,最後回傳符合結構的樹。第二種SCU_Twig方法則是先透過[ACD06]的作法,根據查詢樹抓取符合關鍵字限制的元素資料,接著計算這些元素的LCA,並且加入路徑的判斷,最後再套用TJFast的方式合併。
實驗結果顯示,當查詢句中的關鍵字在檔案中出現的次數不高時,SCU_Twig會較有效率。
In this thesis, we discuss how to combine the technology of Information Retrieval with the XQuery query processing algorithm, so that we could retrieve the data satisfying the structural constraints and the keyword constraints imposed by users.
We propose two methods. One is TJ_IR and the other is SCU_Twig. The first one will convert a user to a query tree. According to the structure of the query tree, the system retrieves the corresponding elements and processes the keyword constraints. Then, the system uses the technique of TJFast to merge and feedback the final results. The second one will retrieve the elements which match the keyword constraints from the query tree, calculate the LCAs, and determine if they match the path constraints. Finally, the system will merge and feedback the results through the technique of TJFast.
The experimental results show that the SCU_Twig system will perform better when the keywords have lower selectivity in the XML data.
第一章 緒論………………………………………..……………………1
1.1 背景與研究動機……………………………...……………………………1
1.2 相關研究……………………………………...………...………………….1
1.3 論文架購……………………………………………………………….…..4
第二章 相關定義……………………………..…………………………5
2.1 XML基本架構……………………………………………………..………5
2.2 XQuery之結構表示式…………………………………………………6
2.3 XQuery之資訊檢索表示式……………………………………………8
2.4 問題描述…………………………………………………………………10
第三章 資料表示……………………………………………………13
3.1 延伸杜威編碼……………………………………………….………..13
3.2 TJ_IR的元素編碼表……………………………………………….…15
3.3 SCU_Twig的關鍵字編碼表……...…………………………….……..19
第四章 TJ_IR系統…………………………………...……………….22
4.1 查詢樹建立模組…………………………………………………….22
4.2 資料擷取和資訊檢索模組…………………………………………....26
4.3 整合模組……………………………………………………………….33
第五章 SCU_Twig系統………….…………………...…………….38
5.1 SCU Table……………………………………………………….38
5.2 整體演算法…………………………………….…………..…….39
第六章 實驗………………………………….……………………..….45
6.1 dataset大小之實驗………………………………………….……………46
6.2 不同資訊檢索限制之實驗………………………………………….……51
6.3 關鍵字頻率影響之實驗………………………………………………….53
6.4 不同節點限制之實驗……………………………………………….57
6.5 相同節點不同限制之實驗……………………………………………….59
6.6 不同查詢句節構之實驗………………………………………………….61
6.7 標籤頻率影響之實驗………………………………………………….62
第七章 結論與未來研究方向…………………………………………65
參考文獻………………………………………………………….…….66
[ACD06] Sihem Amer-Yahia, Emiran Curtmola, Alin Deutsch, "Flexible and Efficient XML Search with Complex Full-Text Predicates", In Proceeding of the SIGMOD Conference, Chicago, Illinois, USA, 2006.
[AKMD+05] Sihem Amer-Yahia, Nick Koudas, Amelie Marian, Divesh Srivastava, David Toman, "Structure and Content Scoring for XML", In Proceedings of the VLDB Conference, Pages: 361–372, Trondheim, Norway, 2005.
[AYJ03] Shurug Al-Khalifa, Cong Yu, H. V. Jagadish, "Querying Structured Text in an XML Database", In Proceedings of the SIGMOD Conference, Jun. 2003.
[BKH02] Nicolas B, Nick K, Divesh S. Holistic Twig joins, "Optimal XML pattern matching", In Proceedings of the SIGMOD Conference, 2002.
[CDZ04] Yi Chen, Susan B. Davidson, Yifeng Zheng, "BLAS : An Efficient XPath Processing System", In Proceedings of the SIGMOD Conference, Pages 47-58, Paris, France, 2004.
[CLTH+07] Songting Chen, Hua-Gang Li, Junichi Tatemura, Wang-Pin Hsiung,
Divyakant Agrawal, K. Selcuk Candan, "Twig2Stack: Bottom-up
Processing of Generalized-Tree-Pattern Queries over XML
Documents", In Proceedings of the VLDB Conference, Pages:
283–294, September 12–15, 2007.
[CKS06] SungRan Cho, Nick Koudas, Divesh Srivastava, "Meta-data Indexing
for XPath Location Steps", In Proceedings of the SIGMOD Conference, June 27–29, Chicago, Illinois, USA, 2006.
[GSBS03] Lin Guo, Feng Shao, Chavdar Botev, Jayavel Shanmugasundaram,
"XRANK: Ranked Keyword Search over XML Documents", In
Proceedings of the SIGMOD Conference, San Diego, CA, June 9-12,
2003.
[G87] G. H. Gonnet: The PAT text searching sytem. Technical report,
University of Waterloo, 1987
[KKNR04] Raghav Kaushik, Rajasekar Krishnamurthy, Jeffrey F. Naughton
, "Raghu Ramakrishnan: On the Integration of Structure Indexes and
Inverted Lists", In Proceedings of the ICDE Conference, 2004.
[LLCC05] Jiaheng Lu,Tok Wang,Ling Chee-Yong Chan,Ting Chen, "From Region
Encoding To Extended Dewey: On Efficient Processing of XML Twig
Pattern Matching", In Proceedings of VLDB Conference, Pages:
193–204, Norway, 2005.
[P85] R. Y. Pinter: Efficient string matching with don't care patterns. In Combinatorial ALgorithms on Words, NATO ASI Series, volume 12, pages11-29, 1985.
[TSW05] Martin Theobald, Ralf Schenkel, Gerhard Weikum, "An Efficient and
Versatile Query Engine for TopX Search", In Proceedings of the VLDB
Conference, 2005.
[XP05] Yu Xu, Yannis Papakonstantinou, "Efficient Keyword Search for
Smallest LCAs in XML Databases", In Proceedings of the SIGMOD
Conference, 2005.
[YLP04] Sihem AmerYahia, Laks V.S. Lakshmanan, Shashank Pandit,
"FleXPath: Flexible Structure and FullText Querying for XML", In Proceedings of the SIGMOD Conference, Pages: 13-18, Paris, France, 2004.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 陳樹村,<扭開制度良性循環的關鍵-論審檢與檢警角色的新定位>,全國律師第1卷第6期,86年6月。
2. 陳運財,<論刑事訴訟制度之改革方向>,律師雜誌第238期,88年7月。
3. 陳運財,<釋字第三九二號解釋與刑事訴訟制度的變革>,刑事法雜誌第41卷第1期,86年2月。
4. 陳運財,<刑事訴訟法之回顧與展望>,月旦法學教室第45期,1999年2月。
5. 邵良正,<美國檢察制度>,東海大學法學研究第2期,74年11月。
6. 林錦村,<論刑事訴訟法新增訂「退案」制度>,法令月刊第49卷第3期,87年3月。
7. 林裕順,<論司法警察於刑事偵查程序中應有的定位-日本刑事訴訟法制上的思考>,月旦法學雜誌第74期,2001年7月。
8. 吳耀宗,<論犯罪偵查之主體-從大法官會議釋字第三九二號解釋所引起的波盪談起>,刑事法雜誌第40卷第4期,85年8月。
9. 吳景欽,<從檢察官強制處分權的逐步廢除探討檢警職權之消長>,法令月刊第53卷第4期,91年4月。
10. 余振華/康順興,<中日檢警關係及偵查主體法制之比較考察>,月旦法學雜誌第56期,2000年1月。
11. 朱楠,<檢察官應擁有強制處分權之剖析>,月旦法學雜誌第6期,1995年10月。
12. 李湧清,<警察績效考核之理論與實際>,警學叢刊第24卷第2期,82年12月。
13. 王兆鵬,<台灣刑事訴訟法制之回顧與前瞻>,律師雜誌第273期,91年6月。
14. 許華偉,<日本檢察制度沿革與檢察廳法初探>,月旦法學雜誌第49期,1999 年6月。
15. 康順興,<自公法原則探討警察偵查權主體法制之研修方向>,全國律師第2卷第12期,87年12月。
 
系統版面圖檔 系統版面圖檔