研究生(外文):Hsin-Ling Yeh
論文名稱:R語言網路應用程式之開發– “Heat Map” 運用在環境健康風險評估之集群分析
論文名稱(外文):R language Web Application Development– Invent “Heat Map” Disease Clustering Analysis for Environment Health Risk Assessment
指導教授(外文):Po-Huang ChiangDer-Ming Liou
外文關鍵詞:heat maprisk assessmentR language
中部沿海工業區(彰化、雲林)屬複合式污染,毒物種類複雜,本研究透過疾病集群分析,瞭解疾病群聚現象,可再進一步探討與環境之相關。過去,疾病群聚研究,須透過Geographic Information Systems(GIS)及空間分析,但僅針對某疾病,欲研究眾疾病,需透過疊圖、排列比較的方式,不僅容易造成畫面複雜、凌亂,且分析軟體成本高;而生物資訊領域多使用Heat Map,將大量資料快速呈現在一圖形中,以瞭解基因群聚的關係。因此,本研究使用免費R語言,嘗試將此方法應用在醫學資訊,將流行病資料以空間及時間呈現,並透過網路應用的方式進行運算。
本研究使用R語言,為開放的免費軟體,主要用於統計分析、繪圖和環境操作,可利用安裝套件(Package)增強使用功能,廣泛運用在各領域中。不過R學習不易,因此將其開發成網頁應用程式,把複雜的程式轉變為點擊式的網頁形式。並與衛生署中部沿海工業區,歷年十大死因資料庫作結合,提供使用者直接於網頁上進行空間及群聚分析。開發方法即透過Java Server Pages(JSP)呼叫R命令稿,並透過網頁語言CSS以及HTML將此分析工具包裝成網頁介面。
最後將此工具實際應用,將資料分別以時間、空間呈現。空間部分,首先透過空間群集顯著檢定(Global Moran’s I, p-value<0.05),找出確實有集群狀況的年度,製作heat map。結果顯示,鄰近鄉鎮有相似的疾病問題,且與沿海工業區廢氣排放分佈相似,並與過去研究結果一致。時空部分,以2001-2011年間雲林女性惡性腫瘤為例,能全觀地看到11年間的時間趨勢及群集模式。

Changhua and Yunlin are two major agricultural counties in Taiwan, where heavy environmental pollution occurred due to rapid industrialization in the 1970’s. As a result, health of residents in certain areas was severely affected. The study used cluster analysis to comprehend the disease clustering and further explore the correlation between disease and environment. Previous studies of a region cluster state of mortality use Geographic Information Systems (GIS) and spatial analysis. However, these methods only focus on one disease and high cost, while we need to combine all the data to overlay and compare outcomes. Thus we are unable to use this method because the final image from using this type of analysis on our data would complicate the presentation of the results.
To facilitate health risk assessment in these areas, this R web tool was developed to identify pollution “hot-spot” areas using a spatial autocorrelation model and heat map with hierarchical clustering in mortality risk. We can then examine the important health risk factors these particular areas. The system was developed with a freeware of R script, Java Server Pages (JSP) that displayed the results of a cluster analysis by permuting the rows and the columns of a matrix of place similar values near each other.
This study used GIS spatial autocorrelation analysis and cluster heat map in the R web tool to survey the relationship between the highest death rate local and industrial pollution by analyzing the top ten leading causes of death in Changhua and Yunlin, from 2001-2011.We found the cluster states of male and female individual in Changhua 2006, 2001 and Yunlin 2005, 2008 spatial analysis were significant (Moran’s I, p-value<0.05). Thus we graphically visualized these clusters and found that in these clusters the industrial air pollution had similar distribution to the death rates. In the other part of this tool, temporal analysis used female death rate of cancer in Yunling, 2001-211.

致謝 i
中文摘要 ii
Abstract iv
目錄 vi
圖目錄 viii
表目錄 ix
第一章 緒論 1
第一節 研究背景 1
第二節 研究動機 3
第三節 研究目的 4
第四節 論文架構 5
第二章 文獻探討 6
第一節 空間分析 6
第二節 Heat Map 7
第三節 R語言 8
第三章 研究架構與方法 10
第一節 研究架構 10
第二節 資料收集與整理 11
一、 研究地區 11
二、 資料收集 11
第三節 網頁開發與設計 12
一、 網頁基本架構 13
二、 Heat Map 14
三、 軟體規格與實作 16
第四節 實際應用與評估 18
一、 應用流程 18
二、 相關方法 19
第四章 結果 21
第一節 網頁介面操作 21
第二節 實際分析 22
一、 空間呈現 22
二、 時空呈現 30
第五章 討論與結論 31
第一節 討論 31
第二節 研究限制 32
第三節 結論 32
參考資料 34
附錄 38
附錄ㄧ、醫療資訊雜誌期刊 38
附錄二、原始程式碼 52

圖2-1、heat map示意圖 8
圖3-1、研究架構 10
圖3-2、R網頁應用架構概念圖 13
圖3-3、矩陣資料轉換示意圖 15
圖3-4、R命令稿計算結果流程圖 17
圖3 5、實際應用流程圖 18
圖4-1、heat map網頁首頁 21
圖4-2、heat map網頁實際操作展示 22
圖4-3、2006年彰化男性heat map 24
圖4-4、2001年彰化女性heat map 25
圖4-5、2005年雲林男性heat map 26
圖4-6、2008年雲林女性heat map 27
圖4-7、2006年彰化男性腎炎LISA圖 28
圖4-8、2008年雲林女性惡性腫瘤LISA圖 29
圖4-9、2006年雲林女性惡性腫瘤時空heat map 30

表3-1、軟體規格 16
表4-1、2001-2011年彰化性別十大死因空間集群顯著檢定 23
表4-2、2001-2011年雲林性別十大死因空間集群顯著檢定 23

