研究生(外文):Hsieh, Yi-Ting
論文名稱(外文):Exploring of Air Quality for Taiwan Using Data Mining Techniques and OLAP
指導教授(外文):Tsai, Cheng-Fa
口試委員(外文):Liu, Ning-HanLin, Wen-YangChen, Chin-Ling
外文關鍵詞:Air Quality of TaiwanData MiningOLAP
近年來,環境過度的開發,導致空氣污染日漸嚴重,進而影響生態環境以及國人健康,空氣品質問題已成為各國關注之議題。根據國際癌症研究署(IARC)公布之消息指出,空氣污染為癌症死亡的首要因子,是第一級致癌物。本論文深入探討臺灣空氣品質,蒐集 2006 年至 2016 年行政院環保署提供的臺灣空氣品質數據,結合資料探勘技術與線上分析處理(OLAP),以從中找出臺灣空氣品質相關的有用知識。研究結果顯示,北部地區以 CO 與 NO2 平均濃度最高,中、南部地區為 PM10 與 PM2.5 平均濃度最高,而離島地區則是 SO2 與 O3 較高,東部地區只受到少數污染物影響。整體而言,臺灣空氣污染濃度逐漸下降中,表示在空氣污染管制上已得到改善,未來也應持續加強,期望空氣品質達到安全標準範圍內。
In recent years, environment has been over-developed led to air pollution more serious, and affected ecosystem and health of people. Many countries pay close attention to the air pollution issue. According to International Agency for Research on Cancer (IARC) indicate that cancer can be caused by air pollution. The air pollution is category one of carcinogen. This thesis aims to air quality for Taiwan, and used Environmental Protection Administration provides data from 2006 to 2016. Data mining technique and OLAP method were used to find the relationship for the air pollution in Taiwan. The results reveal that northern of Taiwan was the highest average concentration of CO and NO2
, and middle and southern of Taiwan were that PM10 and PM2.5 are the highest average concentration. Surrounding islands are the highest average concentration of SO2 and O3, but east of Taiwan were affected by the lowest contaminants. However, air pollution concentration gradually reduced in Taiwan.This shows that air quality was improved by air pollution controlling. In future, air
pollution controlling continues to strengthen and hope air quality will achieve safety standard.
摘要 I
Abstract II
謝誌 III
目錄 IV
圖目錄 VIII
表目錄 XII
壹、 緒論 1
一、 研究背景與動機 1
二、 研究目的 6
三、 研究流程 6
四、 論文架構 8
貳、 文獻探討 9
一、 空氣品質指標(Air Quality Index, AQI) 9
(一) 懸浮微粒(PM10) 12
(二) 細懸浮微粒(PM2.5) 13
(三) 臭氧(O3) 14
(四) 一氧化碳(CO) 15
(五) 二氧化硫(SO2) 16
(六) 二氧化氮(NO2) 16
二、 資料探勘(Data Mining) 17
三、 線上分析處理(On-Line Analytical Processing, OLAP) 17
四、 WEKA(Waikato Environment for Knowledga Analaysis) 19
五、 演算法介紹 20
(一) 決策樹(Decision Tree) 20
(二) K-means 25
(三) 關聯法則(Association rule) 27
參、 研究方法 29
一、 研究架構 29
二、 研究步驟 30
三、 研究對象 34
四、 研究工具 34
五、 研究範圍與限制 35
肆、 研究結果與分析 36
一、 研究環境 36
二、 運用OLAP探討臺灣空氣品質 36
(一) 臺灣空氣品質區、縣市、測站與六大污染物之分析結果 36
1、 懸浮微粒(PM10) 37
(1) 臺灣空氣品質區 37
(2) 臺灣縣市與測站 39
2、 細懸浮微粒(PM2.5) 41
(1) 臺灣空氣品質區 41
(2) 臺灣各縣市與測站 43
3、 二氧化硫(SO2) 45
(1) 臺灣空氣品質區 45
(2) 臺灣縣市與測站 47
4、 一氧化碳(CO) 49
(1) 臺灣空氣品質區 49
(2) 臺灣縣市與測站 51
5、 二氧化氮(NO2) 53
(1) 臺灣空氣品質區 53
(2) 臺灣縣市與測站 55
6、 臭氧(O3) 57
(1) 臺灣空氣品質區 57
(2) 臺灣縣市與測站 59
(二) 指標性污染物(PM2.5)與測站之分析結果 61
三、 運用OLAP探討臺灣空氣污染物排放量 66
(一) 點源 67
(二) 線源 69
(三) 面源 71
四、 運用OLAP探討臺灣空氣品質與健康 72
五、 運用資料探勘之演算法探討臺灣空氣品質 78
(一) 決策樹 79
(二) K-means 85
(三) 關聯法則 91
伍、 結論與未來展望 97
一、 結論 97
二、 未來展望 101
參考文獻 102
作者簡介 106
