研究生(外文):Chuan-Shun Chang
論文名稱(外文):A Study of Change Detection for Sequential Patterns of Numerical Items - Using Rainfall Data as an Example
外文關鍵詞:Sequential patternChange detectionData miningFrequent pattern
Sequential pattern mining is to extract frequent sequentially ordered patterns, which are usually transformed into previously unknown, meaningful, and useful information. Most of past frequent pattern mining researches focused on the effectiveness of algorithms. To increase the utilization of these patterns, they set constraints on time, benefits, and so on. In the aspect of timing, most past studies did not consider change of patterns in different periods. That caused the decline of utilization reference in the collected patterns. Therefore, based on previous researches on change detection of sequential patterns, for items representing different degrees of intensity, we propose a framework to extract change of their sequential patterns in different periods. We consider the intensity difference of the items, and remedy the inconsistency problem, caused by failing to conform the triangular inequality, of previous researches. As for pattern change classification, we propose a new classification method to avoid duplicate classification phenomena in previous researches. Finally, we apply this framework to the public rainfall data provided by Central Meteorological Bureau, to identify changes in the rainfall patterns over the years.
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
第二章 文獻探討 4
2.1 循序樣式探勘 4
2.2 有條件限制的循序樣式探勘 5
2.3 循序樣式變化 7
2.4 降雨預測 10
第三章 數值型項目之循序樣式變化檢測框架 12
3.1 Tsai 與 Shieh 的成果簡介 12
3.1.1產生頻繁循序樣式 13
3.1.2樣式差異度比較 14
3.1.3樣式變化分類 16
3.1.4 Tsai 與 Shieh 的成果總結 18
3.2 頻繁循序樣式探勘 19
3.3 樣式差異度比較 21
3.4 樣式變化分類 28
第四章 實驗 31
4.1 資料來源 31
4.2 產生頻繁循序樣式集 32
4.3 實驗一 33
4.4 實驗二 37
4.4.1案例一 37
4.4.2案例二 41
4.4.3案例三 43
4.4.4案例四 45
4.4.5案例綜合結論 47
4.5 實驗三 49
4.6 長期樣式變化分類結果 52
第五章 結論 55
參考文獻 57

表1:Tsai & Shieh[15]所定義的樣式變化分類準則 17
表2:降雨事件等級 22
表3:字串writer跟author的編輯距離比較 25
表4:展示樣式差異度之範例樣式 27
表5:樣式之編輯距離矩陣範例 27
表6:範例樣式組之DV及各樣式之MD 27
表7:高雄觀測站2007年6月至8月頻繁循序樣式數量 33
表8:高雄觀測站2012年6月至8月頻繁循序樣式數量 33
表9:2007、2012年β=0.125時各下的樣式變化分類數量 34
表10:高雄觀測站2007年及2012年Emerging patterns結果 39
表11:高雄觀測站2007年及2012年的Unexpected change patterns結果 40
表12:高雄觀測站2007年及2012年的Perished patterns結果 40
表13:高雄觀測站2007年及2012年的Added patterns結果 40
表14:玉山觀測站2008年及2009年的Emerging patterns結果 42
表15:玉山觀測站2008年及2009年的Unexpected change patterns結果 42
表17:玉山觀測站2008年及2009年的Added patterns結果 42
表18:花蓮觀測站2010年及2011年的Emerging patterns結果 44
表19:花蓮觀測站2010年及2011年的Unexpected change patterns結果 44
表21:花蓮觀測站2010年及2011年的Added patterns結果 45
表22:板橋觀測站2012年及2013年的Emerging patterns結果 46
表23:板橋觀測站2012年及2013年的Unexpected change patterns結果 46
表24:花蓮觀測站2012年及2013年的Perished patterns結果 47
表25:花蓮觀測站2012年及2013年的Added patterns結果 47
表26:高雄觀測站2011年及2012年視窗長度為8天的樣式變化探勘結果 50
表27:高雄觀測站2011年及2012年視窗長度為14天的樣式變化探勘結果 50
表28:高雄觀測站連續9年6月至8月之來源序列總數及樣式數量 53

圖1:Tsai & Shieh[15]所定義的樣式變化分類標準概念圖 17
圖2:移動單位為8天時的移動視窗概念圖 20
圖3:樣式分類概念圖 29
圖4:2007年高雄觀測站蒐集之降雨事件分佈 32
圖5:β值及值對Unexpected change patterns的數量影響 35
圖6:β值及值對Perished patterns的數量影響 36
圖7:β值及值對Added patterns的數量影響 36
圖8:高雄觀測站2007年及2012年6至8月日累積雨量比較圖 49
圖9:高雄觀測站連續9年6月至8月之Emerging patterns數量 53
圖10:高雄觀測站連續9年6月至8月之Unexpected change patterns數量 54
圖11:高雄觀測站連續9年6月至8月之Perished patterns數量 54
圖12:高雄觀測站連續9年6月至8月之Added patterns數量 54
