跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.87) 您好!臺灣時間:2024/12/03 01:37
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:王浩
研究生(外文):Hao Wang
論文名稱:巨量資料視覺化模型建構之探討大腸癌盛行率與飲用水質關係
論文名稱(外文):Big Data Visualization System Design and Research of Interaction between Colorectal Cancer and Drinking Water
指導教授:翁昭旼翁昭旼引用關係蔣以仁蔣以仁引用關係
指導教授(外文):Jau-Min WongI-Jen Chiang
口試委員:陳中明張淑惠
口試委員(外文):Chung-Ming ChenShu-Hui Chang
口試日期:2016-07-04
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:醫學工程學研究所
學門:工程學門
學類:綜合工程學類
論文種類:學術論文
論文出版年:2016
畢業學年度:104
語文別:中文
論文頁數:45
中文關鍵詞:健保資料庫NoSQL資料庫疾病地圖mongoDB巨量資料資料視覺化
外文關鍵詞:Nation Health Insurance Research DatabaseNoSQL DatabaseDisease MappingBig DataData Visualization
相關次數:
  • 被引用被引用:0
  • 點閱點閱:413
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
資料視覺化是本論文的主軸,它也是使用者與資料溝通最直接的方法,利用D3.js函式庫建立整套疾病地圖系統,透過互動事件與動畫呈現讓使用者感受資料的特性;透過疾病地圖從空間面向觀察臺灣整體的疾病分布與趨勢;透過疾病趨勢圖觀察特定縣市之時間面向資料,展示疾病各年度間的盛行率、通報數以及平均年齡…等不同資訊,同時系統也提供一個便於分析資料的介面清楚地比較不同縣市的差異;利用非同步技術動態載入環境資料庫(自來水水質資料庫、水庫水質資料庫),在整合趨勢圖中隨著時間演進泡泡的位置移動與大小的縮放除了可以瞭解疾病的趨勢也可以觀察特定環境屬性是否與疾病有一定程度上的相關。
本研究系統採用國家衛生研究院全民健康保險研究資料庫百萬人抽樣歸人檔做為疾病資料基礎;為了處理如此大量資料而選用NoSQL資料庫MongoDB做為資料儲存的系統,利用mapreduce技術提升在分散式資料庫查詢的效能並能執行較複雜的運算,剔除不符合條件的就醫紀錄並將原本歸人的資料依據區碼歸檔,建立cache系統避免頻繁的資料庫伺服器存取,將系統資源做最有效的應用。系統開發採用MVC架構,讓系統模組化以增加其擴充性,可依據使用者查詢的疾病代碼(ICD-9)載入適當的預測模組或者功能模組。

The core of this thesis, Data visualization, is a way of user communication with data. Using D3.js tools to build this disease mapping system, which allows user to feel the change of the data by events selection and animation. With the Disease Map function, users are able to observe the distribution of the disease in spatial aspect. With the Disease Trend function, users are able to read the prevalence, count, and average age etc. of any city in time scope. These functions, also provide a interface to compare data between different cities. Loading environment database dynamically, binding with Hybrid Bubble Chart function by observing the position and the radius change of the Bubbles at different time points and let users be able to feel whether is there any relative trend between environment attributes and the disease occurrence.
We used Nation Health Insurance Research Database (NHIR) as the database of this system which contains medical records of a million patients. In order to deal with this enormous amount of patient data, we select MongoDB, which is a distributed document NoSQL database. With mapreduce technique we can run complicated operations. Eliminating those data which doesn’t fit the query condition, then restructure the data by geographical distribution. By using Cache system to keep our database away from busy accessing to increase the query efficiency. We also applied MVC framework to make this system more expendable and able to load specified prediction module or function module depend on the ICD-9 code user input.


誌謝 II
中文摘要 III
ABSTRACT IV
目 錄 V
圖目錄 VIII
表目錄 IX
第一章 緒論 1
1-1研究背景與動機 1
1-2研究動機及目的 2
1-3研究流程 3
第二章 研究材料與相關文獻探討 4
2-1健保資料庫 4
2-2水庫水質監測資料庫 6
2-3自來水水質抽驗資料 7
2-4 D3(DATA-DRIVEN DOCUMENTS) 8
2-5地理資訊資料 9
第三章 系統設計 11
3-1系統環境 11
3-2 NOSQL 12
3-3 MONGODB 13
3-4 D3(DATA-DRIVEN DOCUMENTS) 15
3-5 CACHE系統 18
3-6 系統架構 20
第四章 研究方法 21
4-1資料預處理 21
4-1-1水庫水質監測資料庫 21
4-1-2自來水水質抽驗資料 21
4-1-3健保資料庫 22
4-2 分片(SHARDING) 22
4-2-1 分片目的 22
4-2-2 MongoDB分片機制 23
4-3 MAPREDUCE 25
4-4 資料呈現 27
4-4-1疾病地圖 27
4-4-2疾病趨勢圖 28
4-4-3整合趨勢圖 30
第五章 資料呈現 32
5-1 系統簡介 32
5-2 首頁 32
5-3 結果呈現 33
5-3-1 控制面板 33
5-3-2 疾病地圖 34
5-3-2 疾病趨勢圖 36
5-3-3 整合趨勢圖 38
5-4 疾病趨勢模組 40
第六章 結論與展望 41
6-1 結論 41
6-2 展望 43
參考文獻 44

1.Tai, Y.-M. and H.-W. Chiu, Comorbidity study of ADHD Applying association rule mining (ARM) to National Health Insurance Database of Taiwan. international journal of medical informatics, 2009.
2.Lay, J.-G., K.-H. Yap, and W.-J. Chen, 地理資訊系統應用於登革熱疫情防治之檢討與建議. Environment and Worlds, 2005.
3.衛生福利部疾病管制署, 衛生福利部疾病管制署傳染病統計資料查詢系統. 2015.
4.Ken Ka-Yin Leea, W.-C.T., Kup-Sze Choi, Alternatives to relational database: Comparison of NoSQL and XML approaches for clinical data storage. ELSEVIER, 2012.
5.mongoDB.
6.ESRI Shapefile Technical. 1998.
7.Chang, C.-L., The research and development of disease mapping in Taiwan. 2006.
8.健保資料庫. Available from: http://nhird.nhri.org.tw/.
9.行政院環境保護署環境資源資料開放平台.
10.行政院環境保護署環境資源資料庫. Available from: http://erdb.epa.gov.tw/.
11.Michael Bostock, V.O., and Jeffrey Heer, D3: Data-Driven Documents. 2011.
12.William A Mattingly, R.R.K., Julia H Chariker, Tim Weimken, Julio Ramirez, An iterative workflow for creating biomedical visualizations using Inkscape and D3.js. BMC Bioinformatics, 2015.
13.Scalable Vector Graphics (SVG) 1.1 (Second Edition). W3C, 2006.
14.鄉鎮市區界線(TWD97經緯度). Available from: http://data.gov.tw/node/7441.
15.Butler, H., The GeoJSON Format 2015.
16.dataUsman Iqbal, C.-K.H., Phung Anh (Alex) Nguyen,Daniel Livius Clinciu, Richard Lu, Shabbir Syed-Abdul,Hsuan-Chia Yang, Yao-Chin Wanga, Chu-Ya Huanga,Chih-Wei Huang, Yo-Cheng Changa, Min-Huei Hsu,Wen-Shan Jian, Yu-Chuan (Jack) Li, Cancer-disease associations A visualization and animation through medical big data. ELSEVIER, 2015.
17.Jin-Jing Lee , C.-S.J., Sheng-Wei Wang , Chen-Wuing Liu, Evaluation of potential health risk of arsenic-affected groundwater using indicator kriging and dose response model. 2007.
18.Miao-Ching Chi, Y.-L.H., Yu-Chun Wang, The Effect of Ambient Air Quality on Respiratory Diseases in Taiwan. 2010.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊