跳到主要內容

臺灣博碩士論文加值系統

(34.204.198.73) 您好!臺灣時間:2024/07/19 14:04
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:鄭敬霖
研究生(外文):Jing-Lin Cheng
論文名稱:貝氏變數選取法於不同種族基因資料的比較
論文名稱(外文):Comparison of Bayesian variable selection methods for genetic data from different populations
指導教授:蔡秒玉蔡秒玉引用關係
指導教授(外文):Miao-Yu Tsai
學位類別:碩士
校院名稱:國立彰化師範大學
系所名稱:統計資訊研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:61
中文關鍵詞:羅吉斯混合模式貝氏變數選取法隨機變數選取法可逆的跳躍式馬可夫鏈蒙地卡羅演算法
外文關鍵詞:logistic mixed modelBayesian variable selectionstochastic search variable selectionreversible jump Markov chain Monte Carlo
相關次數:
  • 被引用被引用:0
  • 點閱點閱:283
  • 評分評分:
  • 下載下載:19
  • 收藏至我的研究室書目清單書目收藏:0
  在統計研究中使用混合效應模式對於變數或是模式的選取方法有很多,本文使用完全貝氏變數選取法,它可以更靈活的將先驗訊息涵蓋在變數選取的過程中,並可同時選取固定及隨機效應兩部分。在本篇論文中,考慮在羅吉斯混合模式下比較兩種不同的貝氏變數選取法,分別是隨機變數選取法(stochastic search variable selection; SSVS)以及可逆的跳躍馬可夫鏈蒙地卡羅法(reversible jump Markov chain Monte Carlo; RJMCMC)中的特例H-H演算法(Holmes and Held algorithm)。我們將這兩種貝氏變數選取法用於分析兩組不同種族的基因病例對照資料,藉以觀測先驗分配影響後驗分配的敏感性及MCMC演算法的運算效率,如此用來比較兩種方法的優劣差異。從實例分析結果顯示H-H演算法在考慮了種族結構不確定性下,能夠穩定且有效的辨識真正的候選基因以及基因-基因間關聯性的方法。
Many methodologies for variable or model selection are available in statistical researches. In mixed-effects models, a fully Bayesian variable selection allows a flexible method for incorporation of prior knowledge into the selection of the variables to select the fixed and random components simultaneously. In this talk, we focus on comparing two Bayesian variable selection methods, stochastic search variable selection (SSVS) and Holmes and Held algorithm (H-H algorithm) that is a special case of the reversible jump Markov chain Monte Carlo (RJMCMC) for logistic mixed models. Two genetic case-control data sets from different populations are used to compare the performance of the two Bayesian variable selection methods by assessing the sensitivity of posterior probabilities to prior specifications and the efficiency of the MCMC algorithms. The results indicate that the H-H algorithm is a stable and efficient selection tool in identifying true candidate gene sand gene-gene associations after accounting for the uncertainty in population structures.
摘要 i
Abstract ii
目次 iii
表次 iv
圖次 v
第1章 緒論 1
1.1 研究動機與背景 1
1.2 文獻探討 3
第2章 統計方法 7
2.1 先驗分配與參數設定 9
2.2 H-H演算法 11
2.3 隨機變數選取法 17
2.4 有效樣本數與相對效率 18
2.5 ROC曲線與曲線下面積 19
第3章 實例分析 20
3.1 Hapmap資料 20
3.2 WTCCC之躁鬱症(BD)資料 29
3.3 有效樣本數(ESS)與相對效率(R.E)應用於實例分析 41
3.3.1 HapMap資料 41
3.3.2 WTCCC之BD資料 43
3.4 ROC曲線與曲線下面積應用於實例分析 45
第4章 敏感度分析 49
4.1 HapMap資料 49
4.2 WTCCC之BD資料 52
第5章 討論與總結 56
參考文獻 58
附錄 61
附錄一 H-H演算法中將w與y聯合概似函數對B積分的推導 61

表次
表 3.1.1:SSVS 演算法分析HapMap 資料其固定效應項後驗包含機率前10
高SNPs 與其估計值 .................................................................................... 23
表3.1.2:H-H 演算法分析HapMap 資料其固定效應項後驗包含機率前10 高
SNPs 與其估計值 ......................................................................................... 24
表3.1.3:SSVS 演算法分析HapMap 資料其隨機效應項結果 ........................ 25
表3.1.4:H-H 演算法分析HapMap 資料其隨機效應項結果 .......................... 26
表3.2.1:WTCCC 下BD 資料之SSVS 演算法在0.5 0 p  下固定效應估計值
....................................................................................................................... 31
表3.2.2:WTCCC 下BD 資料之SSVS 演算法在~ (1,1) 0 p beta 下固定效應估
計值 ............................................................................................................... 32
表3.2.3:WTCCC 下BD資料之H-H演算法在0.5 0 p  下固定效應估計值 33
表3.2.4:WTCCC 下BD 資料之H-H 演算法在~ (1,1) 0 p beta 下固定效應估計
值 ................................................................................................................... 34
表 3.2.5:WTCCC 下BD 資料之SSVS 演算法在~ (1,1) 0 p beta 與0.5 0 p  下
隨機效應估計值 ........................................................................................... 36
表3.2.6:WTCCC 下BD 資料之H-H 演算法在~ (1,1) 0 p beta 與0.5 0 p  下隨
機效應估計值 ............................................................................................... 37
表3.3.1:HapMap資料下0.5 0 p  的ESS &; R.E.結果 .................................... 41
表3.3.2:HapMap 資料下~ (1,1) 0 p beta 的ESS &; R.E.結果………………………..…42
表3.3.3:WTCCC 之BD資料下0.5 0 p  的ESS &; R.E.結果 ......................... 43
表3.3.4:WTCCC 之BD資料下~ (1,1) 0 p beta 的ESS &; R.E.結果……………….44
表3.4.1:HapMap 及BD 資料之AUC 值 ......................................................... 47

圖次
圖 3.1.1 :HapMapHapMapHapMap 資料之 資料之 SNPsSNPs 固定效應絕對值估計關係圖,虛線為疾病 固定效應絕對值估計關係圖,虛線為疾病 固定效應絕對值估計關係圖,虛線為疾病 固定效應絕對值估計關係圖,虛線為疾病 固定效應絕對值估計關係圖,虛線為疾病 SNPSNP 位置。 ................................ ................................ ................................ ........... 27
圖 3.1.2 :HapMap 資料之各 SNPs 後驗包含機率關係圖,虛線為疾病 SNP 位置。 ................................ ................................ ................................ ............... 28
圖 3.2.1 :WTCCCWTCCC WTCCC下 BD 資料之 SNPsSNPs 固定效應絕對值估計關係圖,虛線為 固定效應絕對值估計關係圖,虛線為 區分顯著 (左)與不顯著 (右) ................................ ................................ .......... 39
圖 3.2.2 :WTCCCWTCCC WTCCC下 BD 資料其後驗包含機率圖,虛線為區分顯著 資料其後驗包含機率圖,虛線為區分顯著 (左)與不 顯著 (右) ................................ ................................ ................................ ......... 40
圖 3.4.1 :HapMap HapMap 及 BD 資料下 ROCROC 曲線 ................................ ...................... 48
圖 4.1.1 :HapMap HapMap 資料敏感度分析圖 資料敏感度分析圖 ................................ ............................... 51
圖 4.2.1 :BD 資料敏感度分析圖,採用先驗配情況 資料敏感度分析圖,採用先驗配情況 ................................ .... 54
圖 4.2.2 :BD 資料敏感度分析圖,採用固定值情況 資料敏感度分析圖,採用固定值情況 ................................ ........ 55
吳盈儒(2011),貝氏模式選取法在考慮族群分層情況下於基因病例對照資料的應用。國立彰化師範大學統計資訊所碩士論文。
林祿偉 (2012),針對 WTCCC 資料在羅吉斯混合模式下進行貝氏變數選取。國立彰化師範大學統計資訊所碩士論文。
王詩宜 (2012),比較貝氏變數選取法SSVS與RJMCMC:應用於WTCCC資料。國立彰化師範大學統計資訊所碩士論文。
Albert, J. H. and Chib, S. (1993). Bayesian analysis of binary and polychotomous response data. Journal of the American Statistical Association, 88, 669-679.
Brooks, S. P., Giudici, P. and Roberts, G. O. (2003). Efficient construction of reversible jump Markov chain Monte Carlo proposal distributions. Journal of the Royal Statistical Society, Ser. B, 65, 3-55.
Chen, Z. and Dunson, D. B. (2003). Random effects selection in linear mixed models. Biometrics, 59, 762-769.
Fridley, B. L. (2009). Bayesian variable and model selection methods for genetic association studies. Genetic Epidemiology, 33, 27-37.
Gelman, A., Roberts, G. O. and Gilks, W. R. (1996). Efficient Metropolis Jumping Rules. Bayesian Statistics, 5, 599-607.
Geman, S. and Geman, D. (1984). Stochastic relaxation, Gibbs distribution and the Bayesian restoration of image. IEEE Transactions on Pattern Analysis and Machine Intelligence, 6, 721-741.
George, E. I. and McCulloch, R. E. (1993). Variable Selection via Gibbs Sampling. Journal of the American Statistical Association, 88, 881-889.
Geryer, C. J. (1992). Practical Markov Chain Monte Carlo. Statistical Science, 7, 473-511.
Green, P. J. (1995). Reversible jump Markov chain Monte Carlo computation and Bayesian model determination. Biometrika, 82, 711-732.
Green, P. J. (2003). Trans-dimensional Markov chain Monte Carlo. Highly structured stochastic systems. P. J. Green, N. L. Hjort and S. Richardson. Oxford, Oxford University Press, 179-198.
Holmes, C. C. and Held, L. (2006). Bayesian auxiliary variable models for binary and multinomial regression. Bayesian Analysis, 1, 145-168.
Kinney S. K. and Dunson, D. B. (2007). Fixed and random effects selection in linear and logistic models. Biometrics, 63, 690-698.
Laird, N. M. and Ware, J. H. (1982). Random-effects models for longitudinal data. Biometrics, 38, 963-974.
Lamnisos, D., Griffin, J. E. and Steel, M. F. J. (2009). Transdimensional sampling algorithms for Bayesian variable selection in classification problems with many more variables than observations. Journal of Computational and Graphical Statistics, 18, 592-612.
Lee, K. E., Sha, N., Dougherty, E. R., Vannucci, M. and Mallick, B. K. (2003). Gene selection: a Bayesian variable selection approach. Bioinformatics, 19, 90-97.
Purves, R. D. (1992). Optimum Numerical Integration Methods for Estimation of Area-Under-the-Curve (AUC) and Area-Under-the-Moment-Curve (AUMC). Journal of Pharmacokinetics and Biopharmaceutics, 20, 211-266.
Roberts, G. O. and Rosenthal, J. S. (2001). Optimal Scaling for Various Metropolis-Hastings Algorithms. Statistical Science, 16, 351-367.
Smith, M. and Kohn, R. (1996). Nonparameteric regression using Bayesian variable selection. Journal of Econometrics, 75, 317-343.
Swets, J. A. (1961). Is there a sensory threshold? Science, New Series, 134, 168-177.
Swets, J. A. (1988). Measuring the accuracy of diagnostic systems. Science, 240, 1285-1293.
The Wellcome Trust Case Control Consortium. (2007). Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls.
Nature, 447, 661-678.
Zellner, A. and Siow, A. (1980). Posterior odds ratios for selected regression hypotheses. Bayesian Statistics, 31, 585-603.

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top