跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.155) 您好!臺灣時間:2025/11/15 01:46
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:許百欣
研究生(外文):Hsu, Pai-Hsin
論文名稱:為大量資料建構富有彈性的反轉索引檔
論文名稱(外文):Construction Of Flexible Inverted Index For Large Data
指導教授:吳昇吳昇引用關係
指導教授(外文):Wu, Sun
學位類別:碩士
校院名稱:國立中正大學
系所名稱:資訊工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1995
畢業學年度:83
語文別:英文
論文頁數:49
中文關鍵詞:區域索引反轉索引
相關次數:
  • 被引用被引用:0
  • 點閱點閱:315
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0

  在面對著電腦系統內,為數龐大的資料時,我們需要以資訊檢索系統來幫助我們找到我們所需要的資料。有許多資訊檢索系統皆植基於反轉索引技術上。但是使用反轉索引的方法存有一個很大的問題,龐大的反轉索引檔往往佔掉了許多儲存空間。
  在這篇論文內,我們提出一個新的方式來儲存索引,減低反轉索引所造成的空間負擔。不過,反轉索引檔越小,資訊檢索系統的查詢時間也可能因此增加。如此一來,我們在時間和空間的平衡的控制可以更加地有彈性。我們稱呼這種新方法為「區域索引」。
  我們提出幾個演算法來建構區域索引。並且我們會討論演算法之間的異同,以及對於不同的演算法,所造成的反轉索引檔大小及其所需的時間作個比較。在不同的條件因素下,區域索引對於查詢時間的影響也不想相同。我們搜集了一些不同條件下,不同的查詢所須的時間。如此我們可以更清楚地比較出不同條件因素下的區域索引與查詢時間之間的關係。


  When we face a huge volume of data in the computer system, we need information retrieval system to retrieve data which we want. Many information retrieval systems are based on inverted index. The main problem of the inverted index is that the size of inverted file is always very large.
  In this thesis, we proposed a new method called "range index" to store the index list which can reduce the size overhead of inverted index. Our method also allows the users to control the query time and inverted file size tradeoff flexibly.
  We proposed four algorithms for constructing range index. We will discuss these algorithms and compare the difference about size of produced inverted file and the constructing time for each algorithm. In different conditions, the effect of the range index on the query time is not the same. We also collected *. We can see the relationship between the query time and these different conditions of range index.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top