跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.176) 您好!臺灣時間:2025/09/06 00:49
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:郭令証
研究生(外文):Ling-Cheng Kuo
論文名稱:K中心函數型分群法於多變量函數型資料之應用
論文名稱(外文):K-centres Functional Clustering of Multivariate Functional Data
指導教授:李百靈
指導教授(外文):Pai-Ling Li
口試委員:吳碩傑林建華
口試委員(外文):Shuo-Jye WuChien-Hua Lin
口試日期:2015-06-15
學位類別:碩士
校院名稱:淡江大學
系所名稱:統計學系碩士班
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
語文別:中文
論文頁數:116
中文關鍵詞:分群分析多變量函數型資料函數型主成份分析
外文關鍵詞:Clustering analysisMultivariate functional dataFunctional principal components analysis
相關次數:
  • 被引用被引用:0
  • 點閱點閱:402
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
近年來函數型資料分析逐漸受到重視,而函數型資料之分群分析在實務應用上更是重要的議題。本研究主要是想探討多變量函數型資料的分群問題,當樣本中的每個觀察對象均具有多個變量的函數型資料時,如何找到所有觀測對象的合理分群結構是個尚待解決的問題。本研究將提出一套新的 K 中心多變量函數型分群演算法,其根據 Chiou 與 Li (2007) 對單變量函數型資料所提出的 K 中心函數型分群之概念,利用變量本身的變異程度與不同變量間的相關性來決定各變量適當的權數,並以各變量之加權距離來做分群。本文所提出的方法將可於分群時同時考慮到各變量的平均函數與共變異函數等特徵,並根據各變量所包含的分群訊息來調整各變量對於分群的重要性,最後可對多變量函數型資料得到一個單一的分群結果。從數值模擬研究中可發現,K中心多變量函數型分群演算法不僅能改善單變量函數型分群方法的分群正確率,相較於其它現有的多變量函數型分群方法也有較好的表現。此外,在大部份的情況下,給予權數時若能考慮變量本身的變異程度或變量間的相關性,亦可提高分群正確率。本研究進一步提供兩種指標,以作為在實務分析上挑選最佳權數的方法。

Cluster analysis of multivariate functional data is an important issue in real applications. In this study, we propose a novel k-centres multivariate functional clustering (mKCFC) algorithm for the multivariate functional data. The proposed approach is an extension of the k-centres functional clustering method (Chiou and Li, 2007), which is proposed for the univariate functional data, and can take the means and modes of variation differentials among clusters of each variable into account simultaneously. The mKCFC approach adopts a weighted distance for clustering. The weight of each variable represents the importance of a variable to the cluster information and is determined by the within-variable variation or the between-variable correlations. The numerical results of simulations show that the mKCFC method outperforms the other multivariate functional clustering approaches in most cases. Moreover, the weight of mKCFC is flexible and can be chosen by the objective of clustering, and we provide two indices for selecting the optimal weight in this study.

目 錄
第一章 緒論 1
第二章 文獻回顧 3
2.1 單變量函數型主成份分析 3
2.2 多變量函數型主成份分析 7
2.3 K 中心函數型分群演算法 11
第三章 K 中心多變量函數型分群演算法 13
3.1 K 中心多變量函數型分群模型與估計方法 13
3.2 分群準則與步驟 16
3.3 權重的選擇 19
3.4 標準化的影響 23
第四章 數值模擬研究 27
4.1 模擬設計 27
4.2 模擬結果 32
4.2.1 不同參數設定對初始分群結果的影響 38
4.2.2 主成份分數之相關性對分群結果的影響 39
4.2.3 特徵值對分群結果的影響 44
4.2.4 權重對分群結果的影響 47
4.2.5 權重選取 49
4.3 其他模擬研究 53
第五章 結論 56
參考文獻 58
附錄 61
附錄 A 理論推導 61
附錄 B 模擬研究生成資料之圖形 63
附錄 C 多變量函數型主成份分數之散佈圖 66
附錄 D 模擬研究之正確分類率 83
附錄 E 一次模擬樣本之權重 89
附錄 F 模擬設計 Bd 之分群結果 104
表目錄
表4-1 模擬研究設計 28
表4-2 比較方法 32
表4-3 設計A 下各變量之單變量分群結果 35
表4-4 設計B1和B2 下各變量之單變量分群結果 36
表4-5 設計B3和B4 下各變量之單變量分群結果 37
表4-6 100 次分群中CCR 與CH 指標同時選到最佳權重的比例 50
表4-7 100 次分群中CCR 與cASE 同時選到最佳權重的比例 51
表4-8 模擬一之多變量分群結果 55
圖目錄
圖4-1 模擬設計中各變量各群的平均函數圖形 29
圖4-2 各特徵空間的特徵函數 29
圖4-3 模擬設計Aa 的觀測曲線 31
圖4-4 模擬設計Ba1的觀測曲線 31
圖4-5 在設計A 中的平均正確分類率 41
圖4-6 在設計B1 中的平均正確分類率 41
圖4-7 在設計B2 中的平均正確分類率 42
圖4-8 在設計B3 中的平均正確分類率 42
圖4-9 在設計B4 中的平均正確分類率 43
圖4-10 在設計Ba 中的平均正確分類率 45
圖4-11 在設計Bb 中的平均正確分類率 45
圖4-12 在設計Bc 中的平均正確分類率 46
圖4-13 在設計A 中CCR 與兩種指標選出最佳權重的比例 51
圖4-14 在設計B1 和B2 中CCR 與兩種指標選出最佳權重的比例 52
圖4-15 在設計B3 和B4 中CCR 與兩種指標選出最佳權重的比例 52
圖4-16 模擬一之基底函數 53
圖4-17 模擬一之原始函數 54
圖4-18 在模擬一中CCR 與兩種指標選出最佳權重的比例 55

[1] Abraham, C., Cornillon, P. A., Matzner-Lober, E. and Molinari, N. (2003) Unsupervised curve clustering using B-spline. Scandinavian Journal of Statistics, 30:581-595.
[2] Ash, R. B. and Gardner, M. F. (1975) Topics in Stochastic Processes. New York: Academic Press.
[3] Bruno, F. and Cocchi, D. (2002) A unified strategy for building simple air quality indices. Environmetrics, 3:243-261.
[4] Cali′ nski, T. and Harabasz, J. (1974) A dendrite method for cluster analysis. Communications in Statistics, 3:1-27.
[5] Chiou, J.-M. and Li, P.-L. (2007) Functional clustering and identifying substructures of longitudinal data. Journal of the Royal Statistical Society Series, 69:679-699.
[6] Chiou, J.-M., Chen, Y.-T. and Yang, Y.-F. (2014) Multivariate functional principal component analysis: a normalization approach. Statistica Sinica, 24:1571-1596.
[7] Diakoulaki, D., Mavrotas, G. and Papayannakis, L. (1995) Determining objective weights in multiple criteria problems: the critic method. Computers and
Operations Research, 22:763-770.
[8] Fan, J. and Gijbels, I. (1996) Local Polynomial Modelling and Its Application. London: Chapman and Hall.
[9] Ferraty, F. and Vieu, P. (2006) Nonparametric Functional Data Analysis: Theory and Practice. New York: Springer series in statistics.
[10] Hall, P. and Hosseini-Nasab, M. (2012) On properties of functional principal
components analysis. Journal of the Royal Statistical Society: Series B, 68:109-126.
[11] Ignaccolo, R., Ghigo, S. and Bande, S. (2012) Functional zoning for air quality. Environmental and Ecological Statistics, 20:109-127.
[12] Jacques, J. and Preda, C. (2012) Model-based clustering of functional data.
In: 20th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. Bruges,459-464.
[13] Jacques, J. and Preda, C. (2014) Model-based clustering for multivariate functional data. Computational Statistics and Data Analysis, 71:92-106.
[14] James, G. M. and Sugar, C. A. (2003) Clustering for sparsely sampled functional data. Journal of the American Statistical Association, 98:397-408.
[15] Li, P.-L. and Chiou, J.-M. (2011) Identifying cluster number for subspace projected functional data clustering. Computational Statistics and Data Analysis, 55:2090-2103.
[16] Li, Y.-H. and Hsing, T.-L. (2010) Uniform convergence rates for nonparametric regression and principal component analysis in functional/longitudinal data. The Annals of Statistics, 38:3321-3351.
[17] Tarpey, T. and Kinateder, K.K.J. (2003) Clustering functional data. Journal of Classification, 20:93-114.
[18] Ramsay, J. O. and Silverman, B. W. (2005) Functional Data Analysis. New York: Springer series in statistics.
[19] Yao, F., M‥ uller, H. G., Clifford, A. J., Dueker, S. R., Follett, J., Lin, Y., Buchholz, B. A. and Vogel, J. S. (2003) Shrinkage estimation for functional principal component scores, with application to the population kinetics of plasma folate. Biometrics, 59:676-685.
[20] Yao, F., M‥ uller, H. G. and Wang, J. L. (2005) Functional data analysis for sparse longitudinal data. Journal of the American Statistical Association, 100:577-590.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top