資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽
|
首頁
|
關於本站
|
聯絡我們
|
國圖首頁
|
常見問題
|
操作說明
English
|
FB 專頁
|
Mobile
免費會員
登入
|
註冊
切換版面粉紅色
切換版面綠色
切換版面橘色
切換版面淡藍色
切換版面黃色
切換版面藍色
功能切換導覽列
(3.235.228.219) 您好!臺灣時間:2022/07/02 09:31
字體大小:
字級大小SCRIPT,如您的瀏覽器不支援,IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,如為IE7或Firefoxy瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
字體大小變更功能,需開啟瀏覽器的JAVASCRIPT功能
:::
詳目顯示
recordfocus
第 1 筆 / 共 1 筆
/1
頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
QR Code
本論文永久網址
:
複製永久網址
Twitter
研究生:
林德垣
研究生(外文):
Te-Yuan Lin
論文名稱:
巨量資料分割技術與內容快速移動
論文名稱(外文):
Partitioning Technology and Fast Content Movements of Big Data
指導教授:
傅楸善
口試委員:
趙翌川
、
鄧立揚
口試日期:
2013-12-30
學位類別:
碩士
校院名稱:
國立臺灣大學
系所名稱:
資訊網路與多媒體研究所
學門:
電算機學門
學類:
網路學類
論文種類:
學術論文
論文出版年:
2013
畢業學年度:
102
語文別:
英文
論文頁數:
47
中文關鍵詞:
巨量資料
、
大資料
、
海量資料
、
資料庫
、
快速
、
數據庫
外文關鍵詞:
big data
、
partition
、
partitioning
、
map reduce
、
big table
、
database
、
partition table
、
fast
、
archiving
相關次數:
被引用:
2
點閱:1774
評分:
下載:478
書目收藏:1
近年來各式行動裝置與嵌入式系統百花爭鳴, 網路與雲端運算議題的蓬勃發展, 讓與這些應用背後高度相關的資料數據也呈現巨幅成長。企業的資料空間儲存、處理效率議題也因此再度受到重視。自2004年起, Google提出MapReduce技術(http://research.google.com/archive/mapreduce.html), 緊接著在2006年又發表了BigTable (http://research.google.com/archive/bigtable.html ) 後, Google幾乎就等同於Big Data的代名詞, 透過將大量資料切割成數個小資料叢集(Cluster), 並搭配MapReduce的演算法計算查詢索引, 來提升資料查詢的效率。
此類的應用方式雖然帶來一項創新, 但主要應用範圍仍僅止於查詢。對於一般擁有大量交易性資料異動, 且定期或不定期進行不同層次的資料搬遷/移動需求的企業來說, 距離直覺式地應用MapReduce技術到自有的資料數據處理環境中, 仍有一大段距離。特別是金融業、高科技製造業這類通常須面對大量資料的企業, 在巨量的資料異動或移動, 伴隨而來的往往是系統的整體效能緩慢、服務暫時中斷, 資料存取的無效率和分秒必爭商機的損失。
本論文的目的在於以一確實可行的方式, 利用既有的資料數據庫儲存平台, 並加入Partition Table技術, 處理巨量資料的查詢和需要交易異動的需求, 同時解決資料移動時的緩慢效率問題, 提供理論說明與實作兼備的解決方案來改善以上問題。
Database storage storing abundant data usually accompanies slow performance of query and data manipulation. This thesis presents a model and methodology of faster query and data manipulation of mass data rows stored in a big table. In this thesis, it depicts the solution to manipulate large data sets of one table which moves into and out of another logical table with outstanding efficiency compared with traditional transactional way. With this idea, the table structure needs to be redesigned to accommodate and keep data, in other words, the table needs to be "partitioned".
It also covers partitioning strategies which are applied to various scenarios such as the data sliding window scenario, data archiving, and partition consolidation and movement practice.
Chapter 1: Introduction 1
1.1 Motivation 1
1.2 Research Objectives 3
Chapter 2: Rationale of the Study 6
2.1 Database Platforms 6
2.2 Hierarchy of Database Logical Structures 8
2.3 The Pillars of Table and Index 11
2.4 Table and Partition Overview 13
Chapter 3: Methodology 19
3.1 Choosing the Partition Approach 19
3.2 Horizontal Partitioning 20
3.3 Metadata-Only Manipulations 24
3.4 Sliding the Partitions 29
Chapter 4: Implementation and Results 33
4.1 Scenario and Assumption 33
4.2 Experiment Design 34
4.3 Experiment Results 41
Chapter 5: Conclusion 46
References 47
[1] J. Dean and S. Ghemawat, “MapReduce: Simplified Data Processing on Large Clusters,” Proceedings of Symposium on Operating Systems Design and Implementation, San Francisco, CA, pp. 137-149, 2004.
[2] IBM, “The Big Data & Analytics Hub,” http://www.2.com/infographic/four-vs-big-data, 2013.
[3] Microsoft, “Database Engine Instances,” http://technet.microsoft.com/en-us/library/hh231298.aspx, 2013.
[4] Microsoft, “Filestream Overview,” http://technet.microsoft.com/en-us/library/bb933993(v=sql.105).aspx, 2013
[5] Microsoft, “Table and Index Architecture,”
http://technet.microsoft.com/en-us/library/aa174541(v=sql.80).aspx, 2013
[6] Microsoft, “SQL Server Index Design Guide,”
http://technet.microsoft.com/en-us/library/jj835095.aspx, 2013
[7] Microsoft, “Table and Index Organization,” http://technet.microsoft.com/en-us/library/ms189051(v=sql.105).aspx, 2013
[8] Microsoft, “Support for 15,000 Partitions in SQL Server 2008 SP2 and SQL Server 2008 R2 SP1,” http://technet.microsoft.com/en-us/library/gg981694.aspx, 2011
[9] Solid IT, “DB-Engines Ranking,” http://db-engines.com/en/ranking, 2013.
電子全文
國圖紙本論文
推文
當script無法執行時可按︰
推文
網路書籤
當script無法執行時可按︰
網路書籤
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
相關期刊
熱門點閱論文
1.
雲端大數據即時資訊收集與分析架構之設計-以太陽能監控系統為例
2.
運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構
3.
巨量資料分析應用於顧客關係管理之研究
4.
應用於分析信用評估巨量資料的決策樹分類法
5.
NoSQL 雲端資料庫資料模型設計之研究
6.
基於手機App開發之智慧家庭感測系統
7.
大數據對運動表現之分析
8.
論大數據分析與著作權法之保護---以資料庫的建立和檢索為主
9.
提升Hadoop Map Reduce運算效能之研究
10.
探索巨量資料之應用因素
11.
運用NoSQL與Google Maps視覺化呈現健保重大傷病區域分佈
12.
巨量資料分析應用於顧客關係管理之研究
13.
Moving Towards Pure ANSI SQL in NoSQL
14.
連結NoSQL和MapReduce的通用方法
無相關期刊
1.
雲端醫療紀錄之巨量資料存取與處理平台建置
2.
巨量資料的發展現況與趨勢
3.
巨量資料生態雲端策略集群分析-以財務績效指標探討
4.
巨量資料分析—以健保資料為例
5.
巨量資料環境下的持續稽核機制
6.
雲端平台大數據資料庫研究-以報關訊息資料為例
7.
建置巨量資料倉儲系統─以健保資料為例
8.
支援混合式巨量資料整合管理框架
9.
線上測驗學習系統結合巨量資料與適性化應用之研究
10.
巨量資料與個人資料保護法之研究
11.
運用海量數據 (Big data)改善病人安全並減少醫囑資訊系統的給藥錯誤: 機率模式
12.
結合巨量資料及動態網路程序法於宜居城市之永續運輸規劃策略探討
13.
鉅量資料與雲端儲存之專利佈局與研發方向分析
14.
以Hadoop為平台-結合異質資料庫與Hive之加速查詢應用
15.
應用高階模糊派翠網路之巨量資料分析平台
簡易查詢
|
進階查詢
|
熱門排行
|
我的研究室