跳到主要內容

臺灣博碩士論文加值系統

(216.73.217.165) 您好!臺灣時間:2026/05/16 23:09
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:林建宏
研究生(外文):Chien Hung Lin
論文名稱:不同型態缺失資料之各種插補法之比較
論文名稱(外文):Comparing different imputation methods on different types of missing data
指導教授:許玉雪許玉雪引用關係
指導教授(外文):Esher Hsu
學位類別:碩士
校院名稱:國立臺北大學
系所名稱:統計學系
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:48
中文關鍵詞:插補法缺失資料多重插補熱卡插補比率插補回歸插補
外文關鍵詞:Imputationmissing datamultiple imputationHot-deck imputationRatio imputation
相關次數:
  • 被引用被引用:2
  • 點閱點閱:1595
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在一般抽樣調查的過程中,從樣本被選取後,調查工作的展開至要蒐集到我們欲想獲得的資料過程中,常會產生缺失值,而這些缺失值也就是所抽樣單位未提供給我們感興趣變項之足夠資訊。而至今有不少統計學者發展出不少插補理論來企圖讓整體資料更具完整性。
本文主要研究目的有二:
(1) 比較常用插補法在不同缺失型態下之插補精確度。
(2) 提供社會研究者使用插補法處理缺失資料之參考。
本論文主要探討在不同型態的缺失資料下,使用不同之插補方法。所謂的缺失資料型態定義為完全隨機缺失(MCAR)及隨機缺失(MAR),而缺失資料插補的理論繁多,本研究選擇目前市面上較為常用之插補方法,有單一插補及多重插補,其中單一插補方式包含廻歸插補法、EM插補法、熱卡插補法及比例插補法。
最後根據插補後的資料與原先完整資料比對,利用平均絕對離差來比較各插補法的準確及適用的缺失資料類型。
Social researchers commonly suffer missing data issue when they execute a research project. The lack of information easily influences the researcher making wrong decision on important matter. Therefore, many methods were developed to deal with missing data. Among these methods, imputation is one of popular ways in recent years. Generally, missing data covers several types including MCAR, MAR and non-ignorable missing value.
The objective of this study is to provide references for the social researcher applying common imputations to impute missing data. This study selects five main methods of imputation including Em imputation, Regression imputation, Hot-Deck imputation, Multiple imputation and Ratio imputation.
Monte Carlo Simulation is used to simulate the process of five imputations for two types of missing data, MCAR and MAR. The study evaluated the effect of each imputation method by “Bias” and “MSE”. EM imputation and ration imputation perform well in the MCAR or MAR type of missing data and suggested to put in use.
第一章 緒論 2
第一節 研究動機 2
第二節 研究目的 4
第二章 文獻回顧 6
第三章 缺失資料及插補方法 12
第一節 缺失資料的型態介紹 12
第二節 缺失資料的處理方式 14
第三節 插補法的介紹 16
第四節 常見差補法的優缺點 23
第四章 研究方法 26
第一節 蒙地卡羅模擬方式簡述 26
第二節 研究流程概述 27
第三節 產生完整樣本資料集 29
第四節 產生不同型態的缺失值 32
第五節 以插補法對缺失值進行插補 33
第六節 衡量指標之計算 39
第五章 模擬結果 40
第一節 完全隨機缺失 (MCAR) 資料之插補結果 41
第二節 隨機缺失 (MAR) 資料之插補結果 43
第六章 結論與建議 45
參考文獻 47
儲全滋 (1996) 抽樣方法,三民書局。
葉瑞玲 (2000) 統計調查中遺漏值處理之研究以台灣地區消費者動向調查為例。
李興南 (2002) 在樣本完全隨機缺失之多重插補方法的比較分析,國立台灣大學流行病學研究所碩士論文。
李淑暖 (2003) 分層隨機抽樣之缺失資料的插補及其估計式的調整,國立台北大學統計研究所碩士論文。
曹志弘(1999)遺漏值插補方法的比較,國立中央大學統計研究所碩士論文。
賴柔伶 (2000) 統計調查中插補法的研究,輔仁大學應用統計研究所碩士論文。
林曉芳 (2002) 以Hot Deck插補法推估成就測驗之不完整作答反應,國立政治大學教育系教育心理與輔導組博士論文。
劉長萱、蔡政豐(1997) 問卷調查的不完整取樣設計。調查研究,3期,107-27。
翁彰佑、程爾觀 (1991) 隨機遺失資料插補法估計效用之比較。中國統計學報,29,2,111-130。
Cohen, M.P. (1997), “A new approach to imputation”, Proceedings of the Survey Research Methods Section of the American Statistical Association, 293-298.
Cochran, W. G.. (1977), Sampling Techniques, 3rd ed. New York: Wiley.
Dempster, A. P., Laird, N. M. and Rubin, D. B. (1997), “Maximum Likelihood from Incomplete Data via The EM Algorithm.”, Journal of the Royal Statistical Society, Series B 39, 1-38

Fuchs, C. (1982), “Maximum Likelihood Estimation and Model Selection in Contingency Tables with Missing Data”, Journal of the American Statistical Association 77(378), 270-278
Gelfand, A. E. and Bradley, P. C. (1993), “Maximum Likelihood Estimation for Constrained or Missing Data Method”, The Canadian Journal of Statistics 21(3), 303-311
Kim, J. O. and James, C. (1997), “The Treatment of Missing Data in Multivariate Analysis”, Sociological Methods and Research 6(2):215-240.
Little, R. J. A., and Rubin, D. B. (1987), “Statistical Analysis with Missing Data”, Wiley, New York.
Levy, P. S., and Lemeshow, S., “Sampling of Populations: Methods and Applications.”
Rubin, D. B. (1987), “Multiple Imputation for Nonresponse in Surveys”, New York: Jhon Wiley & Sons.
Rubin, D. B. (1988), “An Overview of Multiple Imputation”, Proceedings of the Survey Research Methods Section of the American Statistical Association, 79-84
Rubin, D. B. and Schenker, N. (1986), “Mutiple Imputation for Interval Estimation from Simple Random Samples with Ignorable Nonresponse”, Journal of the American Statistical Association, 81, 366-374.
Rubin, D. B. (1978), “Multiple Imputations in Sample Surveys-A Phenomenological Bayesian Approach to Non-response”, in Proceedings of the Survey Research Methods Section, American Statistical Association, pp. 20-34. Also in Imputation and Editing of Faulty or Missing Survey Data. U.S. Department of Commerce, 1-23.
Wang. N. and Robins, J. M. (1998), “Large-sample theory for parametric multiple imputation procedures.”, Biometrika 85: 935-948.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 劉長萱、蔡政豐(1997) 問卷調查的不完整取樣設計。調查研究,3期,107-27。
2. 翁彰佑、程爾觀 (1991) 隨機遺失資料插補法估計效用之比較。中國統計學報,29,2,111-130。
3. 王錦華(1999)。〈是攝影,也是藝術-從張照堂獲國家文藝獎談起〉。《新朝華人藝術雜誌》,期13,26。台北市:新朝華人。
4. 王智富(1996)。〈現代攝影圖像歸趨〉。《藝術家》,期254,426-437。台北市:藝術家。
5. 李淑萍(2003b)。〈又見V-10-一個攝影團體再出發〉。《現代美術》,期109,24-39。台北市:市立美術館。
6. 林品章、傅銘傳(1996)。〈「黑白展」與台灣美術設計〉。《現代美術》,期68,56-61。台北市:市立美術館。
7. 林志明(2002)。〈攝影影像與台灣當代藝術〉。《典藏今藝術》,期120,74-78。台北市:典藏。
8. 周郁齡(2003a)。〈探討70年代末期V-10視覺藝術群與紀實攝影消長關係下的 主體意識〉。《藝術觀點》,期19,10-15。台南:台南藝術學院。
9. 周郁齡(2003d)。〈攝影界域溶解後-從「幻影天堂-台灣當代攝影新潮流」與「台灣辛美學-影像藝術展」看台灣攝影界域的拓展〉。《藝術家》,期332,260-263。台北市:藝術家。
10. 周本驥(1986)。〈逆旅中的困境-試論張照堂的攝影〉。《當代》,期2,126-138。台北市:合志文化。
11. 許綺玲(2003a)。〈關於V-10昔日展的幾個「現代」身影〉。《典藏今藝術》,期132,150-152。 台北市:典藏。
12. 莊淑惠(1997)。〈仍待開發與深耕-台灣攝影藝術發展歷程與現況〉。《典藏藝術雜誌》,期61,219-224。台北市:典藏。
13. 莊靈(2002)。〈重讀大師-「舊影懷蹤-郎靜山典藏攝影展」〉。《藝術家》,期232,246-249。台北市:藝術家。
14. 莊靈(2003)。〈驀然回首-記「又見V-10視覺藝術群」三十年大展〉。《現代美術》,期109,18-23。台北市:市立美術館。
15. 陳葆真(2003)。〈文人畫的延伸-郎靜山的攝影藝術〉。《故宮文物月刊》,期238,42-57。台北市:故宮博物院。