跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.86) 您好!臺灣時間:2025/02/12 22:52
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:黃齡葦
研究生(外文):Lin-Wei Huang
論文名稱:遺失資料之多重插補法模擬比較研究
論文名稱(外文):Simulation Study for Missing Data with Multiple Imputation
指導教授:劉清
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:農藝學研究所
學門:農業科學學門
學類:一般農業學類
論文種類:學術論文
論文出版年:2005
畢業學年度:93
語文別:中文
論文頁數:57
中文關鍵詞:遺失資料EM法多重插補法拔靴法信賴區間
外文關鍵詞:missing dataEM algorithmmultiple imputationbootstrapconfidence interval
相關次數:
  • 被引用被引用:6
  • 點閱點閱:540
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本研究重點為探討拔靴法(bootstrap method)、資料擴增法(data augmentation)與多重插補法(multiple imputation)對遺失資料(missing data)進行區間估計的成效。一般處理遺失值的方式有很多種,但插補法則較多統計學者使用,插補法可分為單一插補法(single imputation)及多重插補法。在早期因為單一插補法較為方便,所以較為多人所使用,而今日許多軟體漸漸提供多重插補法,讓使用者可以爲遺失值填入多個比單一插補法更有效的值。本研究利用模擬資料,同時用三種方法進行平均數的區間估計,以證明多重插補法的參數估計能力,可以達到與拔靴法的同樣效果。
本研究模擬三種型態的多元常態分布資料,並且設定不同的遺失比例,分別進行拔靴法、資料擴增法與多重插補三種方法的信賴區間估計。結果發現拔靴法在信賴區間估計上,無論樣本大小或是遺失資料比例為何,其估計能力都有一定的水準;資料擴增法則是在小樣本的信賴區間估計較大樣本好,但無論遺失比例為何,資料擴增法都是三種方法中出現最多錯誤估算的;多重插補法的估計效果和拔靴法相當,無論樣本大小或是遺失比例為何,信賴區間幾乎都涵蓋母體參數,尤其在遺失比例高達50%時,多重插補法依舊能準確地估計母體參數,顯示多重插補法所產生的參數估計是可以信賴的。
The purpose of this study is to compare the difference between the method of bootstrap, a data augmentation and multiple imputation for estimating the confidence interval of missing data. In general, there are several methods dealing with missing data, but imputation method is usually used by statisticians. The imputation method can be divided into single imputation and multiple imputation. In early years, single imputation is more convenient. Now lots of software provides the procedure of multiple imputation. The confidence intervals for mean were established by the three methods. Then we show that the multiple imputation is as efficient as bootstrap method.
We simulate data from multivariate normal distribution with three different sample sizes, and set different missing rates it was found that the coverage probability for bootstrap method is approximate to the confidence coefficient. The data augmentation is inferior to both bootstrap method and multiple imputation. The result of the multiple imputation is similar to the bootstrap method. The multiple imputation still estimates the parameters accurately even for high missing rate.
摘 要 I
ABSTRACT II
目 錄 III
表 目 錄 IV
第一章 前 言 1
第二章 方法介紹 3
第一節 遺失值發生機制 3
第二節 方法介紹 4
第三章 資料模擬與分析 11
第一節 資料模擬 11
第二節 拔靴法求信賴區間 12
第三節 資料擴增法求信賴區間 16
第四節 多重插補法求信賴區間 21
第五節 模擬結果 26
第六節 拔靴法與多重插補法比較 39
第七節 實例分析 42
第四章 結果與討論 44
第一節 研究發現 45
第二節 後續研究建議 46
參考文獻 48
附錄A 平均數信賴區間模擬程式 50
附錄B 共變數矩陣信賴區間模擬程式 53
陳信木、林佳瑩(1996)。調查資料之遺漏值的處理-以熱卡插補法為例。調查研究,第3卷:75-106。
趙民德、謝邦昌(1999)。探索真相-抽樣理論和實務。曉園出版社。
李興南(2003)。在樣本完全隨機闕失之多重插補方法的比較分析。台灣大學碩士論文。
Barnard J, and Rubin D.B. (1999), Small sample degrees of freedom with multiple imputation, Biometrika 86: 948-955.
Dempster, A. P., Laird, N. M. and Rubin, D. B. (1977), Maximum likelihood from incomplete data via the EM algorithm, J. R. Statist. Soc. Ser B 39: 1-38.
Efron, B. (1979), Bootstrap methods: another Look at the Jackknife, The Annals of Statistics 7: 1-26.
Efron, B. (1994), Missing data, imputation, and the bootstrap, Journal of the American Statistical Association 89: 463-478.
Efron, B. and Tibshirani, R. (1993), An Introduction to the Bootstrap, London: Chapman and Hall.
Little, R.J.A., and Rubin, D.B. (1987), Statistical Analysis with Missing data, New York: J. Wiley.
Reilly, M. (1993), Data analysis using hot-deck multiple imputation, Statistician 42: 307-313.
Rubin, D.B. and Schenker, N. (1986), Multiple Imputation for interval estimation from simple random samples with ignorable nonresponse, Journal of the American Statistical Association 81: 366-374.
Rubin, D.B.(1976), Inference and missing data, Biometrika 63: 581-592.
Rubin, D.B. (1987), Multiple Imputation for Nonresponse in Surveys, New York: John Wiley.
Rubin, D.B. (1996), Multiple Imputation after 18+ years, Journal of the American Statistical Association 91: 473-489.
Sas Institute Inc., (2002), SAS/STAT User’s Guide: The MI Procedure, SAS Institute Inc., Cary, NC.
Schafer, J. L. (1997), Analysis of Incomplete Multivariate Data, New York: Chapman and Hall.
Schafer, J. L. (1999), Multiple imputation: a primer, Statistical Method in Medical Research 8: 3-15.
Tanner M.A., and Wong W.H. (1987), The calculation of posterior distributions by data augmentation (with discussion), Journal of the American Statistical Association 82: 528-550.
Wang, N. and Robins, J. M. (1998), Large-sample theory for parametric multiple imputation procedures, Biometrika 85: 935-948.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top