跳到主要內容

臺灣博碩士論文加值系統

(3.236.84.188) 您好!臺灣時間:2021/08/05 01:24
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:古欣平
研究生(外文):Shin-Ping Gu
論文名稱:APES相關遺失值插補法之探討與改進─以台灣臭氧資料為例
論文名稱(外文):APES Related Missing Data Imputation Methods and Their Implement─ Using the O3 Level Data of Taiwan as an Example
指導教授:黃孝雲黃孝雲引用關係
指導教授(外文):Hsiao-Yun Huang
學位類別:碩士
校院名稱:輔仁大學
系所名稱:應用統計學研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:62
中文關鍵詞:遺失值插補法
外文關鍵詞:Missing dataImputationAPESMCMCGAPESMAPES
相關次數:
  • 被引用被引用:0
  • 點閱點閱:164
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
資料蒐集總避免不了會有缺失數值的情形,無論此原因是屬於人為或是天候所造成的,在資料分析前的首要步驟就是處理遺失値。本文對於以小時蒐集到的空氣污染物濃度,因測量時間相近而彼此具有相關的情形提出時間數列裡頻率域的方法進行插補,藉由APES衍生出GAPES法與MAPES法。在MAPES法又可細分為MAPES-EM1和MAPES-EM2,依照遺失值缺失的情形不同,使用這三種不同的插捕方法,並將此方法與SAS中的MCMC進行插補效果的比較。本研究針對資料裡具有趨勢的情形,提出使用插補法前應先去除掉資料裡的趨勢再予以插補,預期資料在不被趨勢所影響下的插補效果會優於原先未去趨勢的情形。
首先,本研究對於原始資料進行模擬,將模擬的資料製造出不同的遺失值長度,其長度由原資料的百分之十增長至百分之七十,並且遺失情形也分為連續遺失以及隨機遺失兩種狀況,最後藉由RMSE(均方誤)作為最後插補效果的比較。最終由模擬與實例分析的結果,驗證MAPES確實在隨機遺失時,具有較佳的插補情形,並且此方法插補的情形比MCMC還要好。另外,此三種方法並不會隨著遺失的長度增長而使插補效果驟降,但在資料長度上,越短的資料長度,具有越好的插補效果且演算的時間較短,最重要的是本研究所提去趨勢的想法確實降低了RMSE的數值,使得插補的數值更接近實際數值。
Most of the data are collected from questionnaires or machines. As time goes on, the database might have missing data due to artifact or record error. Hence, it is very important to imputate the missing data before the analysis process or else researchers would not be able to analyze the data.
Moreover, when there is missing data to be imputated and the data are correlated to each other, it is very important to retain the property of data.
In my article, there are three imputation methods: GAPES, MAPES-EM1 and MAPES-EM2 respectively. These methods belong to frequency field at time series. Through simulation, we can get imputable effect at different missing data length and the conditions of missing data. Besides as mentioned above, my study will also compare three imputations with MCMC of SAS and discuss about the impact on imputable effect by removing trend.
After analysis, we can conclude, based on the RMSE, MAPES is the best imputation at any conditions of missing data and the imputable effect is improved through the removal of trend in data. Also, imputable effect does not decline as the imputation methods used are not related to the increase in the number of missing data. No matter the data length, MCMC of SAS doesn’t performance better than MAPES. Lastly in smaller data, the algorithms require lesser time than long data and can still get the precise estimation of the missing data.
目錄

表次 III
圖次 IV
第一章 緒論 1
第一節 研究背景 1
第二節 研究動機 4
第三節 研究目的 5
第二章 文獻探討及研究工具 7
第一節 遺失值的形成 7
第二節 遺失值的種類 7
第三節 遺失資料的處理方法 9
I. 單一插補法 10
II. 多重插補法 14
第四節 光譜分析 16
第五節 其他相關研究方法 18
第六節 研究工具 19
第三章 研究方法與改進方法 20
第一節 研究架構 20
第二節 研究方法 21
一、 完整資料─APES演算法 21
二、 遺失資料─GAPES演算法 22
三、 遺失資料─MAPES演算法 26
四、 遺失資料─MAPES-EM1演算法 30
五、 遺失資料─MAPES-EM2演算法 33
六、 SAS中的MCMC 36
七、 改進方法 38
第三節 研究流程 39
第四章 研究結果 41
第一節 模擬資料 42
第二節 模擬研究 45
第三節 實例研究 53
第五章 結論與建議 61
參考文獻 i
中文參考文獻 I
英文參考文獻 I
附錄A 脈衝反應(Impulse Response) iii
附錄B 模擬日資料之RMSE相關情形 iv
附錄C 模擬小時資料之RMSE相關情形 vi
附錄D MCMC與MAPES之RMSE x
附錄E 實際資料之RMSE相關情形 xi
附錄F 總資料與切割資料插補效果比較 xviii
林曉芳,「以Hot Deck插補法推估成就測驗不完整作答反應」,國立政治大學教育研究所博士論文,2002。
楊棋全,「指數與韋伯分布遺失値之處理」,國立中央大學統計研究所碩士論文,2004。
周曉華,「Multiple Imputation for Missing Data」,遺失資料多重插補方法研討會,台北:國立台北大學統計學系主辦,2006年12月22、23日。
Ford, B.L. (Ed), “An overview of hot-deck procedures”, New York: Academic Press, 1983.
G. Latini and G. Passerini, “Handling Missing Data Applications to Environmental Analysis”, Published by WIT Press, 2004.
J. Li and P. Stoica, “An adaptive filtering approach to spectral estimation and SAR imaging,” IEEE Trans. Signal Processing, vol. 44, no. 6, pp. 1469-1484, June 1996.
Little, R.J., and Rubin. D.B., “Statistical analysis with missing data”, New York: John Wiley and Sons, 1987.
P. Stoica, E. G. Larsson, and J. Li, “Adaptive filterbank approach to restoration and spectral analysis of gapped data,” Astron. J., vol. 120, pp.2163-2173, Oct. 2000.
Rebecca M. Warner, David A.Kenny, “Spectral Analysis of Time-Series Data”, The Guilford Press, New York London,1998.
Roth, P.L., and Switzer, F.S.“A monte carlo analysis of missing data techniques in a hrm setting”, Journal of Management, Vol. 21, No. 5, 1003-1023.
Roth, P.L., “Missing data: A conceptual review for applied psychologists”, Personnel Psychology, Vol. 47 Issue 3, p.p. 537-560.
Susan M. Fox-Wasylyshyn and Maher M. El-Masri, “Focus on Reserch Methods Handling Missing Data in Self-Report Measures”, Research in Nursing and Health, vol. 28, 2005, p.488-495.
Schafer, Joseph L. and Olsen, Maren K., “Multiple imputation or multivariate missing data problems: A data analyst’s perspective”, Multivariate Behavioral Research, Vol. 33, p.p. 545-571, 1998.
SAS System 9.0, “The MI Procedure”, SAS Institute Inc., 2002
Tabachnick, B.G., and Fiedell, L.S., “Using multivariate statistics (4th ed.), Boston: Allyn and Bacon.
Y. Wang, P. Stoica, J. Li, “Nonparametric spectral analysis with missing data via the EM algorithm”, Digital Signal Processing, vol. 15, no.2, p.p. 191-206, March 2005.
Yanwei Wang, Jian Li, and Petre Stoica, “Spectral Analysis of Signals”, Morgan & Claypool Publishers, 2005.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top