跳到主要內容

臺灣博碩士論文加值系統

(100.28.0.143) 您好!臺灣時間:2024/07/13 16:56
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:汪澤文
研究生(外文):Wan, Che-Wen
論文名稱:理解E-values及應用至COVID-19全球疫情資料分析
論文名稱(外文):Understanding E-values and an Application to Global COVID-19 Data Analysis
指導教授:黃禮珊
指導教授(外文):Huang, Li-Shan
口試委員:趙蓮菊謝文萍林聖軒
口試委員(外文):Chao, AnneHsieh, Wen-PingLin, Sheng-Hsuan
口試日期:2021-12-20
學位類別:碩士
校院名稱:國立清華大學
系所名稱:統計學研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2021
畢業學年度:110
語文別:中文
論文頁數:60
中文關鍵詞:因果推論線性模型決定係數相對風險台灣
外文關鍵詞:Bounding factorCausalityLinear modelR-squareRelative riskTaiwan
相關次數:
  • 被引用被引用:0
  • 點閱點閱:629
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在observational study的統計研究中,研究員常常會拿P-value來評估一項exposure-outcome模型的association。然而這樣的association是causal的嗎?如何評估一項observational study在exposure與outcome之間的因果性呢?本篇論文將以能夠解釋因果性的全新的統計量「E-value」作為研究的切入,首先探討其背後數學理論的基礎,再應用E-value到COVID-19全球疫情的資料上。本論文修正了E-value背後數學推導的瑕疵,並且得到了在2021/3/31的時候,世界疫情的對數確診數與對數死亡數呈現二次式模型的r-square=0.93、對數人口數與對數確診數呈現線性模型的r-square=0.49,以及對數人口數與對數死亡數呈現線性模型的r-square=0.49的結果。我們另外分析了4/7,4/15以及7/15的資料,也得到了與3/31的模型擬合類似的結果。最後,本論文比較了友邦國家相較於非友邦國家的疫情嚴重程度的相對風險以及E-values,並且對其做出了統計上的解釋。
In an observational study, researchers often use p-values to evaluate the exposure-outcome association. However, is such an association causal? This thesis was motivated by a new statistic ``E-value" that can explain causality and was recently introduced in the literature. In an attempt to understand E-values, we followed its derivations and found that some parts of its proofs need clarifications. In this thesis, we fill some small gaps of the proofs and then apply E-values to analyze data of the COVID-19 pandemic. We compare the relative risks and E-values of the severity of the epidemic between countries who have and do not have diplomatic relations with Taiwan, and discuss some interpretations of the results.
1 緒論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
1.1 研究動機. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 E-value 的探索. . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 深入了解E-value . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.3 E-value 的應用. . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 研究架構. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 背景介紹. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
2.1 符號標記定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Relative Risk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 定義名詞:RRobsED、RREU、RRUD、RRtrueED . . . . . . . . . . . . . 4
2.3.1 RRobsED、RREU、RRUD . . . . . . . . . . . . . . . . . . . . . 4
2.3.2 RRtrueED . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3.3 整理定義名詞. . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4 敏感度分析(Sensitivity Analysis) . . . . . . . . . . . . . . . . . . 7
2.4.1 Ding and VanderWeele 提出的敏感度分析. . . . . . . . . . 7
2.5 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5.1 哺餵母乳與嬰兒呼吸道感染. . . . . . . . . . . . . . . . . . 8
2.5.2 營造業勞工與職業疾病. . . . . . . . . . . . . . . . . . . . 8
2.5.3 本節小結論. . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.6 E-value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.6.1 「解釋掉(explain away)」用詞定義. . . . . . . . . . . . . 9
2.6.2 E-value 的點估計. . . . . . . . . . . . . . . . . . . . . . . . 9
2.6.3 E-value 的區間估計. . . . . . . . . . . . . . . . . . . . . . 11
2.6.4 整理E-value 定義名詞. . . . . . . . . . . . . . . . . . . . . 11
2.6.5 E-value 的解釋. . . . . . . . . . . . . . . . . . . . . . . . . 11
2.6.6 E-value 的舉例. . . . . . . . . . . . . . . . . . . . . . . . . 11
3 修正Bounding Factor 的證明. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13
3.1 定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 RRUD 以及RREU 的性質,與我們給出的證明. . . . . . . . . . . 14
3.3 Lemmas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4 Proposition A.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.5 Proposition A.2.,Bounding Factor 的證明. . . . . . . . . . . . . . 16
3.5.1 證明的開頭. . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.5.2 證明的中間. . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.5.3 證明的末段. . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.5.4 Proposition A.2「證明的中間」的瑕疵,以及我們修正後
的證明. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 實際資料應用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20
4.1 資料介紹. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.2 資料前處理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.3 資料視覺化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.3.1 case-death 確診死亡關係圖. . . . . . . . . . . . . . . . . . 23
4.3.2 population-case 人口確診關係圖. . . . . . . . . . . . . . . 28
4.3.3 population-death 人口死亡關係圖. . . . . . . . . . . . . . 32
4.3.4 資料視覺化小結論. . . . . . . . . . . . . . . . . . . . . . . 35
4.4 Relative Risk 與E-value . . . . . . . . . . . . . . . . . . . . . . . . 36
4.4.1 資料分類與計算方式. . . . . . . . . . . . . . . . . . . . . . 36
4.4.2 case-death 結果. . . . . . . . . . . . . . . . . . . . . . . . . 37
4.4.3 population-case 結果. . . . . . . . . . . . . . . . . . . . . . 38
4.4.4 population-death 結果. . . . . . . . . . . . . . . . . . . . . 38
4.4.5 Relative risk 與E-value 分析小結論. . . . . . . . . . . . . 39
4.5 7/15 的資料分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.5.1 7/15 case-death 確診死亡關係圖. . . . . . . . . . . . . . . 40
4.5.2 7/15 population-case 人口確診關係圖. . . . . . . . . . . . 43
4.5.3 7/15 population-death 人口死亡關係圖. . . . . . . . . . . . 46
4.5.4 7/15 資料視覺化小結論. . . . . . . . . . . . . . . . . . . . 48
4.5.5 7/15 Relative Risk 與E-value . . . . . . . . . . . . . . . . . 49
4.5.6 case-death 3/31 與7/15 比較. . . . . . . . . . . . . . . . . 49
4.5.7 population-case 比較. . . . . . . . . . . . . . . . . . . . . . 50
4.5.8 population-death 比較. . . . . . . . . . . . . . . . . . . . . 51
4.5.9 Relative Risk 與E-value 比較小結論. . . . . . . . . . . . . 52
5 結論與未來研究方向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .54
5.1 結論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.1.1 E-value 理論基礎的修正. . . . . . . . . . . . . . . . . . . . 54
5.1.2 COVID-19 疫情資料的分析. . . . . . . . . . . . . . . . . . 54
5.1.3 COVID-19 友邦國家疫情資料分析後的引申. . . . . . . . . 55
5.2 未來工作與未來研究方向. . . . . . . . . . . . . . . . . . . . . . . 55
5.2.1 未來工作. . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2.2 未來研究方向. . . . . . . . . . . . . . . . . . . . . . . . . . 56
6 附錄. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57
6.1 Causal Inference 說明. . . . . . . . . . . . . . . . . . . . . . . . . 57
6.1.1 Potential outcome 介紹. . . . . . . . . . . . . . . . . . . . 57
6.1.2 Conditional unconfoundedness 介紹. . . . . . . . . . . . . . 57
參考文獻. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .59
[1] VanderWeele TJ, Ding P. (2017). Sensitivity analysis in observational research: introducing the E-value. Ann Intern Med. 167:268-74.
[2] Agresti A. (2013). Categorical Data Analysis, 3rd Edition.
[3] Ding P, VanderWeele TJ. (2016). Sensitivity analysis without assumptions. Epidemiology. 27:368-77.
[4] Victora CG, Smith PG, Vaughan JP, Nobre LC, Lombardi C, Teixeira AM, et al. (1987). Evidence for protection by breast-feeding against infant deaths from infectious diseases in Brazil. Lancet. 2:319-22.
[5] Ip S, Chung M, Raman G, Chew P, Magula N, DeVine D, et al. (2007). Breastfeeding and Maternal and Infant Health Outcomes in Developed Countries. Evidence Report/Technology Assessment no. 153.(Prepared by Tufts-New England Medical Center Evidence-based Practice Center under contract no. 290-02-0022.) AHRQ publication no. 07-E007. Rockville: Agency for Healthcare Research and Quality;
[6] Moorman PG, Calingaert B, Palmieri RT, Iversen ES, Bentley RC, Halabi S, et al. (2008). Hormonal risk factors for ovarian cancer in premenopausal and postmenopausal women. Am J Epidemiol. 167:1059-69.
[7] Ritchie H, Mathieu E, Rodés-Guirao L, Appel C, Giattino C, Ortiz-Ospina E, et al. (2021). Coronavirus Pandemic (COVID-19). Published online at OurWorldInData.org. URL https://ourworldindata.org/coronavirus
[8] R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/.
[9] Wickham H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4. URL https://ggplot2.tidyverse.org.
[10] Slowikowski K, Schep A, Hughes S, Dang TK, Lukauskas S, Irisson JO, et al. (2021). ggrepel: Automatically Position Non-Overlapping Text Labels with ’ggplot2’. URL https://github.com/slowkow/ggrepel
[11] Aragon TJ, Fay MP, Wollschlaeger D, Omidpanah A. (2020). epitools:Epidemiology Tools. URL https://cran.r-project.org/web/packages/epitools/index.html
[12] Mathur MB, Ding P, Riddell CA, VanderWeele TJ. (2018). Web Site and R Package for Computing E-values. Epidemiology. 29:e45-e47.
[13] Grilli L, Rampichini C. (2011). Introduction to causal inference via potential outcomes. Dept. of Statistics, University of Florence. https://www.bristol.ac.uk/media-library/sites/cmm/migrated/documents/ci-potential-outcomes.pdf
[14] VanderWeele TJ, Ding P, Mathur Maya. (2019). Technical Considerations in the Use of the E-value. Journal of Causal Inference. 7(2):20180007. https://doi.org/10.1515/jci-2018-0007
電子全文 電子全文(網際網路公開日期:20270112)
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top