跳到主要內容

臺灣博碩士論文加值系統

(44.222.189.51) 您好!臺灣時間:2024/05/18 19:15
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:徐小鈞
研究生(外文):Hsu, Hsiao-Chun
論文名稱:多點膨脹截斷卜瓦松迴歸模型之研究
論文名稱(外文):A study on Multiple-Inflated Truncated Poisson Regression Model
指導教授:林定香林定香引用關係蔡旻曉蔡旻曉引用關係
口試委員:林定香蔡旻曉高菲菲
口試日期:2013-06-19
學位類別:碩士
校院名稱:國立臺北大學
系所名稱:統計學系
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:74
中文關鍵詞:計數資料零膨脹截斷卜瓦松分配
外文關鍵詞:count datazero-inflatedtruncated Poisson distribution
相關次數:
  • 被引用被引用:0
  • 點閱點閱:788
  • 評分評分:
  • 下載下載:34
  • 收藏至我的研究室書目清單書目收藏:1
計數資料 (count data) 廣泛存在於各個領域中,實際搜集到的計數資料經常包含過多的「零值」與某些「非零正整數」,例如一個月內有幾天覺得身體不適,受試者的回答集中於 0 天、 30 天、 5 與 7 倍數的天數。這類過多的「零值」與某些「非零正整數」發生的現象為多點膨脹 (multiple-inflation)。
本論文將延伸零膨脹卜瓦松分配 (Zero-inflated Poisson distribution) 的概念,研究問卷調查中常見到「某行為在兩星期內發生天數」的題目,將事件發生的天數分成膨脹值與非膨脹值,前者包含「 0 」、「 14 」、「 5 」、「 7 」、「 10 」值,並假設它們發生的機率服從多項分配 (Multinomial distribution);後者為假設事件發生數服從截斷卜瓦松分配 (truncated Poisson distribution),在此假設下可推導出多點膨脹截斷卜瓦松模型。再分別利用邏輯斯模型 (logistic model) 與對數連結的 (log link) 截斷卜瓦松模型,建立多點膨脹截斷卜瓦松迴歸模型 (Multiple-inflated truncated Poisson regression model, MITP)。
本論文在模擬研究中,比較截斷卜瓦松分配、零膨脹截斷卜瓦松分配、零 M 膨脹截斷卜瓦松分配與多點膨脹截斷卜瓦松分配四種迴歸模型,在不同因素下,資料配適的表現。這些因素包含生成資料的模型、樣本數、解釋變數斜率、零膨脹率與 M 膨脹率,並以概似比檢定選擇在各種因素下的最佳模型。
模擬結果顯示,不同的樣本數與解釋變數斜率並不會影響各模型資料配適的表現;生成資料的模型、零膨脹率與 M 膨脹率則會影響各模型資料配適的表現,而概似比檢定之結果只會受到生成資料模型的影響。在實證研究中,以 2010 年健康危害行為監測系統 (Behavioral risk factor surveillance system) 的問卷調查內容,探討截斷卜瓦松分配、零膨脹截斷卜瓦松分配、零 M 膨脹截斷卜瓦松分配與多點膨脹截斷卜瓦松分配四種迴歸模型配適實際資料的情況。研究結果顯示,本論文所提出的多點膨脹截斷卜瓦松迴歸模型配適表現最佳。

The count data are quite common in various fields, and excessive zeros and some non-zero positive integers often occur in real data, for example, number of days subjects felt uncomfortable in the past month. The respondents often answer 0, 30, and multiples of 5 and 7. The situation is an example of multiple-inflated data.
In this study, we extended the concept of zero-inflated Poisson distribution, and used the number of some certain behavior in two weeks as a case. The events can be grouped two parts: inflated values and non-inflated values; the former include values of 0, 14, 5, 7 and 10, with Multinomial distribution, the latter were truncated Poisson distribution. We propose a multiple-inflated truncated Poisson regression model, and the model is a mixture of the multinomial logistic and the truncated Poisson regression.
In the simulation study, we compared the goodness of fit of TP, ZIP, ZMITP and MITP models and used likelihood ratio test for model selection. The effects we studied are true model, sample size, explanatory variable, zero and M proportions.
The simulation study showed that the goodness of fit affected by true model, zero proportion and M proportion, but not sample size and explanatory variable. The empirical study used 2010 behavioral risk factor surveillance system data to compare the performance of the four regression models. The results show that the multiple-inflated truncated Poisson regression model outperforms the other models.

目錄
第 1 章 緒論 1
1.1 研究背景 1
1.2 研究目的 2
1.3 論文結構 2
第 2 章 文獻探討 4
2.1 截斷卜瓦松分配 (truncated Poisson distribution, TP) 4
2.2 膨脹模型 5
2.2.1 零膨脹卜瓦松迴歸模型 6
2.2.2 零 K 膨脹卜瓦松迴歸模型 7
2.3 模擬文獻回顧 8
第 3 章 研究方法 11
3.1 研究模型 11
3.1.1 零膨脹截斷卜瓦松迴歸模型 (Zero-inflated truncated Poisson Regression, ZITP) 11
3.1.2 零 M 膨脹截斷卜瓦松迴歸模型 (Zero-and-M-inflated truncated Poisson Regression, ZMITP) 12
3.1.3 多點膨脹截斷卜瓦松迴歸模型 (Multiple-inflated truncated Poisson , MITP) 13
3.2 研究模型之參數估計 17
3.3 模擬研究 20
3.3.1 模擬參數設定 20
3.3.2 模擬流程 23
第 4 章 模擬分析 24
4.1 配適模型的 MAE 與 MSE 24
4.2 樣本數的探討 28
4.3 解釋變數斜率的探討 31
4.4 零膨脹率的探討 33
4.5 M 膨脹率的探討 36
第 5 章 實例分析 38
5.1 資料來源 38
5.2 資料說明 39
5.3 模型分析 40
第 6 章 結論與建議 44
6.1 研究結論 44
6.2 未來研究方向 46
參考文獻 48
中文文獻 48
英文文獻 48
附錄 A:最大概似法的一階偏導函數之推導 48
附錄 B:模擬結果附表 60

圖目錄
圖 4-1:四種真實模型下各迴歸模型配適資料之 MAE 平均值 25
圖 4-2:四種真實模型下各迴歸模型配適資料之 MSE 平均值 26
圖 5-1:「過去兩星期內感到疲倦或是較沒有活力」實際人數次數分配 40
圖 5-2:實際觀測人數與四種迴歸模型的期望人數 42

表目錄
表 3-1:參數組合 22
表 4-1:四種真實模型下各迴歸模型配適資料之 MAE 25
表 4-2:四種真實模型下各迴歸模型配適資料之 MSE 26
表 4-3:四種真實模型下各模型概似比檢定之結果 27
表 4-4:四種迴歸模型在不同樣本數下配適資料之 MAE 29
表 4-5:四種迴歸模型在不同樣本數下配適資料之 MSE 29
表 4-6:四種迴歸模型在不同樣本數下概似比檢定之選模比例 30
表 4-7:四種迴歸模型在不同參數下配適資料之 MAE 32
表 4-8:四種迴歸模型在不同參數下配適資料之 MSE 32
表 4-9:四種迴歸模型在不同參數下概似比檢定之選模比例 33
表 4-10:三種真實模型在不同零膨脹率配適資料之 MAE 平均值 34
表 4-11:三種真實模型在不同零膨脹率配適資料之 MSE 平均值 35
表 4-12:三種真實模型在不同零膨脹率下概似比檢定之選模比例 35
表 4-13:二種真實模型在不同 M 膨脹率配適資料之 MAE平均值 36
表 4-14:二種真實模型在不同 M 膨脹率配適資料之 MSE平均值 37
表 4-15:兩種真實模型在不同 M 膨脹率下概似比檢定之選模比例 37
表 5-1:實際觀察人數與四種迴歸模型的期望人數 41
表 5-2:四種迴歸模型配適資料的 MAE 與 MSE 43
表 5-3:概似比檢定之選模比例 44
表 B-1:真實模型為 TP 之模擬結果 60
表 B-2:真實模型為 ZITP 之模擬結果 61
表 B-3:真實模型為 ZMITP 之模擬結果 64
表 B-4:真實模型為 MITP 之模擬結果 69


王文華 (2009) 台灣地區自殺企圖者之重複自殺企圖次數統計模型探討。國立政治大學統計研究所碩士論文。
王存同 (2010) 零膨脹模型在社會科學實證研究中的應用─以中國人工流產影響因素的分析為例。中國社會科學研究,149,130-148。
鄧詠竹 (2012) 零 膨脹卜瓦松迴歸模型之研究。國立台北大學統計研究所碩士論文。
Agarwal, D.K., Gelfand, A.E., Citron-Pousty, S. (2002) Zero-inflated models with application to spatial count data. Environmental and Ecological Statistics, 9, 341-355.
Angers, J.F., Biswas, A. (2003) A bayesian analysis of zero-inflated generalized poisson model. Computational Statistics and Data Analysis, 42, 37-46.
Behavioral risk factor surveillance system (BRFSS), http://www.cdc.gov/brfss/.
Böhning, D. (1994) A note on test for Poisson over-dispersion. Biometrika 81, 418-419.
Centers for disease control and prevention (CDC), http://www.cdc.gov/.
Lambert, D. (1992) Zero-inflated poisson regression, with an application to defects in manufacturing. Technometrics, 34, 1-14.
Lin, T.H., Tsai, M.H. (2013) Modeling Health Survey Data with Excessive Zero and K Responses. Statistics in Medicine, 32, 1572-1583.
Melkersson, M., Olsson, C. (1999) Is visiting the dentist a good habit? Analyzing count data with excess zeros and excess ones. Umeå economic studies, No.492.
Mullahy, J. (1986) Specification and Testing of Some Modified Count Data Models. Journal of Econometrics, 33, 341-365.
Ridout, M.S., Demetrio, C.G.B., Hinde, J.P. (1998) Models for count data with many zeros. International Biometric conference, 179-192.
Rider, P.R. (1953) Truncated poisson distributions. Journal of the American Statistical Association, 48, 826-830.
Staub, K.E., Winkelmann, R. (2011) Consistent estimation of zero-inflated count models: University of Zurich, Socioeconomic Institute.
Yip, K., Yau, K. (2005) On modeling claim frequency data in general insurance with extra zeros. Insurance: Mathematics and Economics, 36, 153-163.


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top