跳到主要內容

臺灣博碩士論文加值系統

(44.222.104.206) 您好!臺灣時間:2024/05/28 00:52
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:戴義陽
論文名稱:觀察研究的匹配抽樣估計法
指導教授:陳仁義陳仁義引用關係
學位類別:碩士
校院名稱:國立中正大學
系所名稱:數理統計研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:66
中文關鍵詞:觀察研究匹配抽樣
相關次數:
  • 被引用被引用:0
  • 點閱點閱:194
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
蓋洛普市場調查公司是世界上頗具權威的公司,但是於1948 年
也發生了一項錯誤,當時民主黨由紐約州長杜威出馬競選,而共和黨
由現任總統杜魯門角逐連任,蓋洛普公司依民調顯示民主黨的杜威以5 %至15 %的優勢領先競選連任的杜魯門,但選舉結果杜魯門卻以4.4
%贏了杜威勝出,學者們研究發現一項重大的原因:當時蓋洛普公司
以電話訪問收集資料,但是當時共和黨選民的電話的普及率較民主黨
選民電話的普及率來的高,因此所獲得民主黨選民的資料之代表性較
為不足,導致預測的結果和開票結果南轅北轍。這個問題突顯出一項
重要的訊息:當我們在收集資料時,可能會因為某些不可抗拒或忽略
的因素,使得樣本的訊息無法充分反應母體,而造成偏差(Bias)的
產生,觀察研究中的資料收集常會有這種觀測的不可抗拒的因素,因
此如何有效化減偏差是很重要的。匹配抽樣 ( Matching Sampling )
可用來作為觀察研究中降低偏差的重要方法,就是以相似背景的資
料,去找到足以匹配對象,減低因背景的不同所產生的偏差。舉例來
說醫院為了宣導吸煙行為對人體的害處,也就是吸煙者的健康指標遠
比不吸煙者來的差很多,假若研究者只以醫院收集的病人資料(內
容包含吸煙與否,收縮壓值及舒張壓數值,肺功能指數),並將其
樣本的收縮壓平均差來宣稱吸煙和未吸者的平均收縮壓差距有大,這
個結論看來似乎合理,但是仔細研究發現吸煙者的資料其實較不能表
現母體的特性,也就是研究者所獲得的資料的代表性不足,因為吸煙
者通常比較不注重自己的身體健康,非要等到身體出現警訊才會去醫
院接受檢查及治療,因此年紀輕( 20 歲以下)的吸煙者及年紀較長
的吸煙者( 70歲以上)可能比較不願意去醫院接受檢查,因此難以
獲得這類型的資料,而未吸煙者比較愛惜自己的身體,所以常會去醫
院檢查,其資料量往往比吸煙者多的多,因此就會發現其實兩樣本的
在年齡這個變數上的分佈是不相同,所以只是以收縮壓平均差來結論
吸煙者的平均收縮壓比未吸煙者的平均收縮壓來的高多少,可能會誇
大是否吸煙對收縮壓的平均差,為了補救這種偏差,我們可以可以利
用Rubin (1973 a) 論文中提出的平均值匹配法( Mean matching )及
成對匹配法( Pair matching ),Cochran (1968) 提出分層匹配法
(Subclassification matching)來減少偏差,增加結論的可信度。在此
我們稱健康指標(收縮壓值及舒張壓數值,肺功能指數)為反應變數
(response variable),年齡為匹配變數( matching variable)。Rubin
(1973 a) 論文中彙整的了匹配抽樣最常用的兩個方法平均值匹配法
及成對匹配法,其中成對匹配法又可依匹配變數的排列順序區分為三
種:(1)由低至高排列,(2)由高至低排列,(3)隨機排列。
第二章先簡述反應變數和匹配變數和效應及偏差的關係並定義
符號,再將整理出來的結果,如匹配對偏差減少的影響,及上述三種常用的匹配方法的精神及步驟,使讀者對匹配抽樣有初步的認識,第三章我們以實際資料的各項參數為基礎,嘗試模擬吸煙行為對於健康指數(如收縮壓):在已知的吸煙者和未吸煙者的母體分佈下,我們提出兩種方法:(1)均勻抽樣(Uniform Sampling),(2)左偏抽樣(Left
Skew Sampling),刻意製造出吸煙者的年齡分佈和未吸煙者的年齡分佈不同使偏差顯著,當作我們所觀察到的吸煙者的資料。並由未吸煙者母體中隨機抽樣,當作未吸煙者的資料,以這兩組樣本當作觀察研究的對象來觀察並比較其偏差減少的情形,我們發現匹配變數(年齡
)的分佈對於匹配的結果影響很大,如果在兩組樣本個數差距很大,
則影響較小,第四章中將實際的資料以不同的匹配方法觀察經過匹
配之後未吸煙者年齡的平均值和標準差是否和吸煙者年齡的平均值
和標準差相距不遠,藉以評估匹配的效果,再比較匹配之後未吸煙者健康指標的平均值和標準差是否和吸煙者健康指標的平均值和標準差相差的情形,接著以Rubin (1973 a)中評估匹配法輔以密度圖,藉此評估各種匹配法的優劣。最後於第五章結論做了一些討論。

一、 前言 ……………………………………………………… 1
二、 匹配抽樣的符號及一般的步驟 …………………………… 4
2.1 匹配抽樣的符號 …………………………………… 4
2.2 理論上匹配抽樣的步驟 …………………………… 5
2.3 效應及偏差 ………………………………………… 6
2.4 三種匹配的方法 …………………………………….. 11
三、 模擬資料分析 ……………………………………………… 16
3.1 模擬實際資料進行分析 …………………………….. 16
3.2 模擬樣本資料………………………………………... 20
3.3 檢定是偏差是否顯著 …………………………….. 22
3.4 模擬結果 …………………………………………… 23
四、 真實資料分析 …………………………………………. 27
4.1 實際資料的初步分析 …………………………….. 27
4.2 實際資料分析結果 ……………………………… 31
五、 結論 ……………………………………………………. 39
六、 參考文獻……………………………………………… 41
七、 附錄 ……………………………………………………… 42

1. 吳土城撰 (1992),”匹配抽樣”,國立中正大學應用數學研究所碩士論文
2. Rubin, D.B (1973a),” Matching To Remove Bias Observational Studies” , Biometrics 29 159-183
3. Cochran, W.G (1968) “The effectiveness of Adjustment by Subclassification in Removing Bias in Observational Studies” Biometrics 24 295-313
4. Rosenbaum,P.R (1995) “Observational Studies” ,Springer-Verlag

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top