跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2024/12/06 03:26
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:洪靜茹
研究生(外文):Hung, Ching-Ju
論文名稱:缺失資料處理對多變量變異數分析(MANOVA)的影響
論文名稱(外文):The Effect of the Missing Data Techniques for Multivariate analysis of variance(MANOVA)
指導教授:王鴻龍王鴻龍引用關係
指導教授(外文):WANG, HONG-LONG
口試委員:王鴻龍博士鄭天澤博士雷淑儀博士
口試委員(外文):WANG, HONG-LONG
口試日期:2013-01-28
學位類別:碩士
校院名稱:國立臺北大學
系所名稱:統計學系
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:92
中文關鍵詞:缺失處理缺失結構插補法台灣教育長期追蹤資料庫(TEPS)多變量變異數分析(MANOVA)
外文關鍵詞:Missing treatmentMissing patternImputation methodTEPSMultivariate analysis of variance(MANOVA)
相關次數:
  • 被引用被引用:1
  • 點閱點閱:1544
  • 評分評分:
  • 下載下載:99
  • 收藏至我的研究室書目清單書目收藏:0
一般問卷調查結果往往因為受訪者個人因素而有所疏漏,例如受訪者單純漏填某問項,亦或是較為敏感政治議題或收入等涉及個人隱私問項,而未填答。許多社會科學及心理健康問卷中經常發生此情形,此時研究者囿於一般統計軟體限制,而刪除不完整資料之受訪者問卷,以完整資料進行分析。但被刪除的資料有時具備隱藏之訊息,且缺失比例太高,剩餘資料又不足以代表資料全貌,並可能扭曲問卷最後分析結果。故探討缺失資料問題,從中獲得缺失資料所呈現之訊息,成為問卷處理之重要議題。
本研究以「台灣教育長期追蹤資料庫」( Taiwan Education Panel Survey ,TEPS)2001年學生問卷及家長問卷為研究對象,並針對心理健康問題共15題變項,根據原有缺失結構,建構出一倍、三倍、五倍、七倍、十倍之缺失資料集(大約是5%、14%、23%、31%及41%缺失比例)。並依不同缺失比例隨機建構各30組,共計150組缺失資料集進行缺失資料之處理。本研究之缺失處理方法為整筆刪除法(List-wise Delete ,LD)、可用資料法(Available Case ,AC) 、逐步邏輯斯迴歸插補法(Stepwise Logistic regression, SLR)及蒙地卡羅馬可夫鏈法(Monte Carlo Markov Chain ,MCMC)。探討在不同比例之缺失資料集下,不同缺失處理方法分別與完整資料集(baseline)在使用多變量變異數分析時顯著因子個數、R2變化、自變數係數等差異做比較,並提出當缺失比例低(約5%)各缺失處理方法差異不大。而缺失比例高(約14%以上),MCMC法為四種缺失處理方法中,缺失處理後最接近完整資料集之方法。

In general, the outcomes of survey will be incomplete because of the respondent's personal factors. For instance, respondents merely miss to fill out some items, or reject to fill out items regarding privacy such as sensitive political issues and personal revenue. It is a common case in many social science and mental health surveys. For the sake of the restriction on ordinary statistics software, researchers have to exclude those respondent's surveys with missing data to analysis in complete data. But sometimes there are a few hidden information in deleted data and probably the results of the survey will be distorted. For the reasons mentioned above, we have to investigate the missing data's problems to get some figures showed in missing data. It becomes the important topics of survey treatment.
In this study, we use Taiwan Education Panel Survey's questionnaire of students and their parents in 2001 for objects, and aim at 15 mental health questions. According to the raw missing patterns, we create five missing data sets which are one time, three, five, seven, and ten times.(The missing percentage is about 5%, 14%, 23%, 31%, 41% respectively.) We also randomly creative five groups of 30 missing data sets respectively(150 sets in total) based on different missing percentage to process the missing data. The methods of missing treatment in this study are List-wise Delete(LD), Available Case(AC), Stepwise Logistic regression(SLR), and Monte Carlo Markov Chain(MCMC). In different missing data sets, we compare the different missing treatment and baseline when both of two are used for Multivariate analysis of variance (MANOVA) on numbers of significant factors, variations of R-square, and coefficients of dependent variables. The finding shows that there is little difference as the missing percentage is low(about 5%), and the MCMC is the closest method to baseline among fours after missing treatment when the missing percentage is high(about 14%).

第一章 緒論 1
1.1研究背景與動機 1
1.2研究目的與重要性 3
1.3研究流程 4
第二章 文獻探討 5
2.1缺失資料之處理探討 5
2.2關於青少年心理健康使用多變量變異數分析之研究 7
2.3使用台灣教育長期追蹤資料庫關於心理健康之探討 8
第三章 研究方法 9
3.1缺失資料的型態 9
3.2影響資料缺失的顯著變數 10
3.2.1台灣教育長期追蹤資料庫 10
3.2.2變項概述 10
3.2.3基本問項 11
3.3建立缺失資料集 13
3.4建立缺失機制 14
3.5建立不同比例之缺失資料集 15
3.6完整資料集之多變量變異數分析 16
3.6.1依變項概述 16
3.6.2自變項概述 17
3.7缺失資料處理方法 19
3.8缺失處理方法對多變量變異數分析影響 20
3.8.1顯著因子個數與比例 20
3.8.2 R2大小變化 22
3.8.3自變數係數變化情形 22
第四章 研究結果 24
4.1影響心理變項缺失的缺失機制模型 24
4.1.1影響資料缺失的顯著變數探討 24
4.1.2建立缺失機制模型 25
4.2建立不同比例之缺失資料集 28
4.3完整資料集之多變量變異數分析結果 29
4.3.1顯著因子比較 29
4.3.2多變量變異數分析結果 35
4.4各缺失處理方法對多變量變異數分析結果之影響 42
4.4.1顯著因子個數與比例 42
4.4.2 R2大小變化 45
4.4.3自變數係數變化情形 47
4.4.4綜合討論 51
第五章 結論與建議 52
參考文獻 55
附錄A:缺失資料集之缺失結構 57
附錄B:缺失資料集之缺失比例 66
附錄C:五因子模型之多變量檢定(Wilks' Lambda 變數選擇法)摘要表 75
附錄D:四因子各模型之多變量檢定(Wilks' Lambda 變數選擇法)摘要表 78
附錄E:三因子各模型之多變量檢定(Wilks' Lambda 變數選擇法)摘要表 84
附錄F:各缺失資料集(Wilks' Lambda 變數選擇法)顯著因子個數折線圖 89
圖1.1:研究流程圖 4
圖4.1:各缺失資料集正確、低估、高估顯著因子比例折線圖 44
圖4.2:各心理健康指標R2與完整資料集R2比例折線圖 46
圖4.3:各心理健康指標平均MAE變化折線圖 47
圖4.4:各心理健康指標平均RMSE變化折線圖 49
表4.1:向前逐步邏輯斯迴歸係數與相關統計檢定結果表 26
表4.2:向後逐步邏輯斯迴歸係數與相關統計檢定結果表 27
表4.3:缺失資料集之樣本數與缺失比例 28
表4.4:五個因子之多變量檢定(Wilks' Lambda 變數選擇法)主要效果摘要表 29
表4.5:模式各分量檢定摘要表 30
表4.6:四個因子之多變量檢定(Wilks' Lambda 變數選擇法)主要效果摘要表 31
表4.7:四因子模型分量檢定摘要表 31
表4.8:三個因子之多變量檢定(Wilks' Lambda 變數選擇法)主要效果摘要表 33
表4.9:三因子模型分量檢定摘要表 34
表4.10:心理健康四因子多變量變異數分析摘要表 35
表4.11:父或母每日陪孩子時間別與父母婚姻關係別之多變量變異數分析單純主要效果摘要表 39
表4.12:父或母每日陪孩子時間別與綜合分數別之多變量變異數分析單純主要效果摘要表 40
表4.13:父母婚姻關係別與家庭收入別之多變量變異數分析單純主要效果摘要表 41
表4.14:各缺失處理方法顯著因子個數比較表 42
表4.15:各缺失處理方法正確、低估、高估顯著因子比例比較表 43
表4.16:各缺失處理方法R2比較表 45
表4.17:各缺失處理方法MAE比較表 48
表4.18:各缺失處理方法RMSE比較表 50

Brown, C. Hendricks (1983). Asymptotic comparison of missing data process for estimating factor loadings, Psychometrika, Vol. 48, No, 2, p. 269-291.
Kamakura, Wagner A. and Wedel, Michel (2000). Factor analysis, missing data, discrete variables, data fusion, item non-response, Journal of Marketing Research, Vol. 37, Issue 4, p. 490-498.
Liu, Chuanhai and Rubin, Donald B. (1998). Maximum likelihood estimation of factor analysis using the ECME algorithm with complete and incomplete data, Statistica Sinica, Vol. 8, p.729-747.
Rubin, Donald B. and Thayer, Dorothy T. (1982). EM algorithms for ML factor analysis, Psychometrika, Vol. 47, No, 1, p. 67-76.
Schafer, Joseph L. and Graham, John W. (2002). Missing Data: Our View of the State of the Art. Psychological Methods. Vol. 7, No. 2, p.147–177.
Schafer, Joseph L. and Olsen, Maren K. (1998).Multiple imputation for multivariate missing-data problems: A data analyst’s perspective. Multivariate Behavioral Research, Vol.33, NO. 4. p.545-571.
Yang, Meng-Li and Tam, Tony(2004). Mental Health Inequality in the Adolescent Society: Family Background and the Paradox of Academic Success in Taiwan. 發表於國際社會學會(ISA) RC28學術會議中發表。瑞士Neuchatel。
王鴻龍、楊孟麗、陳俊如、林定香(2012)。缺失資料在因素分析上的的處理方法之研究。教育科學研究期刊,第五十七卷第一期,29-50。
吳逸萱(2006)。家庭危機與轉機:以青少年心理健康問題和偏差行為為例。靜宜大學青少年兒童福利研究所碩士論文。
呂喻恩(2007)。不同遺失機轉遺失資料插補法之比較研究。國立臺南大學測驗統計研究所碩士論文。
林曉芳(2002)。以Hot deck插補法推估成就測驗之不完整作答反應。國立政治大學教育學系研究所博士論文。
林英明(2008)。技專校院學生的課業壓力、壓力反應與壓力因應方式之相關研究。國立彰化師範大學工業教育與技術學系博士論文。
林欣潔(2012)。缺失資料處理方法對巢狀迴歸分析的影響。國立臺北大學統計學系研究所碩士論文。
張舒晴(2009)。隨機作答模式於確認概似估計法伴隨共變數缺失之邏輯斯迴歸有效性探討。逢甲大學統計與精算所碩士論文。
陳香利(2005)。國小學童的家庭結構、依附風格與幸福感之相關研究。國立高雄師範教育大學碩士論文。
陳玉芳(2006)。青少年憂鬱概念、憂鬱程度與求助態度之相關研究。國立臺灣師範大學教育心理與輔導學系碩士論文。
陳俊如(2008)。不完整等級資料在因素分析上的處理方法之研究。國立臺北大學統計學系研究所碩士論文。
陳瑛姍(2009)。高級中學學校因素與學生學業能力關連性之研究―TEPS資料庫之應用。國立臺灣師範大學教育學系研究所碩士論文。
黃齡葦(2005)。遺失資料之多重插補法模擬比較研究。國立台灣大學農藝學研究所碩士論文。
黃禎貞、林世華(2010) 。台灣與美國青少年心理健康泛文化比較之研究。中華心理衛生學刊第二十三卷第三期,465-491。 
葉瑞鈴(2000)。統計調查中遺漏值處理之研究-以臺灣地區消費者動向調查為例。輔仁大學應用統計學研究所碩士論文。
楊孟麗(2005)。教育成就的價值與青少年的心理健康。中華心理衛生學刊,第十八卷第二期,75-99。
鄭雅心(2007)。探討國三青少年個人、家庭、學校因素對憂鬱情緒之影響。國立成功大學教育研究所碩士論文。
黎秀蕾(2009)。多重插補方法處理缺失資料之因素分析-以「臺灣教育長期追蹤資料庫」之第二波高中、高職、五專學生樣本資料為例。國立臺北大學統計學系研究所碩士論文。
劉畢琳(2010)。多重插補法在非完整資料統計分析上之應用。國立台灣大學農藝學研究所碩士論文。
劉毓婷(2012)。不同地區國中生學習態度與幸福感之研究。國立新竹教育大學人資處教育心理與諮商學系碩士論文。

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top