|
目錄 1 緒論 1 2 主成分分析於區間資料之維度縮減 2 2.1 中心式主成分分析 (Centers PCA, C-PCA) . . . . . . . . . . . . . . . . . . . . . . 2 2.2 頂點式主成分分析 (Vertices PCA, V-PCA) . . . . . . . . . . . . . . . . . . . . . . 3 3 機率主成分分析於區間資料之應用 4 3.1 機率主成分分析 (Probabilistic PCA, PPCA) . . . . . . . . . . . . . . . . . . . . . 5 3.2 中心式機率主成分分析 (Centers Probabilistic PCA, C-PPCA) 及頂點式機率主成分 分析 (Vertices Probabilistic PCA, V-PPCA) . . . . . . . . . . . . . . . . . . . . . 6 4 模擬研究 6 4.1 PCA 與 PPCA 的模擬研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 4.2 PCA 與 PPCA 於區間資料之模擬研究 . . . . . . . . . . . . . . . . . . . . . . . . . 12 5 實際區間資料之維度縮減 19 5.1 金融紀錄資料 (Finance data) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 5.2 人臉資料 (Face Data) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6 結論與討論 24 7 參考文獻 26
圖目錄 圖 1 Normal(0, 1) 函數圖形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 圖 2 Gamma(2, 1) 函數圖形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 圖 3 Beta(6, 2) 函數圖形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 圖 4 Beta(0.5, 0.5) 函數圖形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 圖 5 X 1 ,··· ,X 5 來自 Normal(0, 1) 的模擬區間直方圖 :(a) 固定帶寬 , (b) 不固定帶寬。 . . 13 圖 6 X 1 ,··· ,X 5 來自 Gamma(2, 1) 的模擬區間直方圖 :(a) 固定帶寬 , (b) 不固定帶寬。 . . 14 圖 7 X 1 ,··· ,X 5 來自 Beta(6, 2) 的模擬區間直方圖 :(a) 固定帶寬 , (b) 不固定帶寬。 . . . . 15 圖 8 X 1 ,··· ,X 5 來自 Beta(0.5, 0.5) 的模擬區間直方圖 :(a) 固定帶寬 , (b) 不固定帶寬。 . . 16 圖 9 Finance data 透過 C-PCA 、 C-PPCA 、 V-PCA 、 V-PPCA 等四種方法降維並視覺化之 圖形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 圖 10 Face data 中的六個變數示意圖 (Leroy et al, 1996) . . . . . . . . . . . . . . . . . 22 圖 11 face data 透過 C-PCA 、 C-PPCA 、 V-PCA 、 V-PPCA4 種方法降維並視覺化之圖形 . 23
表目錄 表 1 PCA 與 PPCA 在 Normal(0, 1) 分配與各種遺失比例下維度縮減至一個方向 , 並重複 模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 . . . . 8 表 2 PCA 與 PPCA 在 Gamma(2, 1) 分配與各種遺失比例下維度縮減至一個方向 , 並重複 模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 . . . . 9 表 3 PCA 與 PPCA 在 Beta(6, 2) 分配與各種遺失比例下維度縮減至一個方向 , 並重複模 擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 . . . . . 10 表 4 PCA 與 PPCA 在 Beta(0.5, 0.5) 分配與各種遺失比例下維度縮減至一個方向 , 並重複 模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 . . . . 11 表 5 C-PCA 與 C-PPCA 在 Normal(0, 1) 之模擬區間值資料且在各種遺失比例下 , 維度縮 減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 13 表 6 C-PCA 與 C-PPCA 在 Gamma(2, 1) 之模擬區間值資料且在各種遺失比例下 , 維度縮 減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 14 表 7 C-PCA 與 C-PPCA 在 Beta(6, 2) 之模擬區間值資料且在各種遺失比例下 , 維度縮減至 一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 15 表 8 C-PCA 與 C-PPCA 在 Beta(0.5, 0.5) 之模擬區間值資料且在各種遺失比例下 , 維度縮 減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 16 表 9 V-PCA 與 V-PPCA 在 Normal(0, 1) 之模擬區間值資料且在各種遺失比例下 , 維度縮 減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 17 表 10 V-PCA 與 V-PPCA 在 Gamma(2, 1) 之模擬區間值資料且在各種遺失比例下 , 維度 縮減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 17 表 11 V-PCA 與 V-PPCA 在 Beta(6, 2) 之模擬區間值資料且在各種遺失比例下 , 維度縮減 至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 18 III 表 12 V-PCA 與 V-PPCA 在 Beta(0.5, 0.5) 之模擬區間值資料且在各種遺失比例下 , 維度 縮減至一個方向 , 並重複模擬 200 次計算其特徵向量之平均值與標準差 ( 真實方向為 (1, 1, 1, 1, 0, 4)) 。 18 表 13 金融紀錄資料 (Finance data) (Vu, Vu & Foo, 2003) . . . . . . . . . . . . . . . . 19 表 14 Finance data 使用 C-PCA 、 C-PPCA 、 V-PCA 、 V-PPCA 4 種方法之特徵向量。 . . . 20 表 15 Face data 使用 C-PCA 、 C-PPCA 、 V-PCA 、 V-PPCA 4 種方法之特徵向量。 . . . . . 22
|
| |