(3.238.7.202) 您好!臺灣時間:2021/02/26 15:22
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:曾家莉
研究生(外文):ZENG, JIA-LI
論文名稱:比較識別癌症重要標靶基因組方法的表現
論文名稱(外文):The Comparison of Methods to Identify Important Target Genomes of Cancer.
指導教授:黃怡婷黃怡婷引用關係
指導教授(外文):HWANG, YI-TING
口試委員:汪群超曾議寬滕涵菁黃怡婷
口試委員(外文):WANG, CHUN-CHAOTSENG, YI-KUANTERNG, HARN-JINGHWANG, YI-TING
口試日期:2020-05-28
學位類別:碩士
校院名稱:國立臺北大學
系所名稱:統計學系
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2020
畢業學年度:108
語文別:中文
論文頁數:102
中文關鍵詞:Z 檢定GISTIC 系統方法分割法染色體基因組拷貝數拷貝數變異符號檢定
外文關鍵詞:Chromosomal genomeCopy numberCopy number variationGISTIC system methodSegmentationSign testZ test
相關次數:
  • 被引用被引用:0
  • 點閱點閱:40
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:4
  • 收藏至我的研究室書目清單書目收藏:0
癌症在已開發國家是主要死亡原因之一,在台灣更是長年位居十大死因之首。基因突變是造成癌症主要成因,許多癌症診斷 與標靶治療的開發皆仰賴瞭解基因組突變的位置,因此若可找到 突變基因組其確切位置,會有利癌症診斷與後續治療。

基因組突變通常是一段基因發生拷貝數增加或減少,稱為拷 貝數變異。GISTIC 系統方法是現階段最常用來分析重要標靶基因 組變異位置的系統。運用 GISTIC 系統方法進行資料檢定前,需 要先對資料進行前處理與分割,再經由 GISTIC 檢定方法來評估 拷貝數變異資料。不過 GISTIC 系統方法使用流程繁複,且流 程間可能會交互影響,本研究透過模擬不同特性的數據資料,來 瞭解 GISTIC 系統方法流程與流程間方法的交互影響,並提出修 正分割方法與使用 Z 檢定與符號檢定,使 GISTIC 系統方法有更 好使用彈性,並將方法運用於 Snijders 等人 (2001) 所釋出的資料, 最後本論文會提供每個方法適合的使用時機,以利未來使用該系 統方法進行更深入研究。




Cancer is not only one of the leading causes of death in developed countries, but also one of the top ten causes of death in Taiwan over the years. Gene mutation is one of the major causes of cancer. The cancer diagnosis and targeted therapy investment are typically relied on identifying the location of gene mutations. It might be beneficial to the cancer diagnosis and the subsequent treatment.

The genome mutation occurs when the copy number of genes increase or de- crease abnormal, which is referred to the copy number variation (CNV). The GISTIC system method is currently the most commonly used system method to analyze the location of important target genome variations. Three procedures are required when assessing GISTIC, including data preprocessing, segmentations, and testing for CNV. Except preprocessing, the procedures might be interacted with each other. Monte Carlo simulations are used to investigate how segmentations and testing for CNV are influenced by various data characteristics. Besides the existing methods, this thesis revises the method for finding gene segments and testing for the CNV. Data providedby Snijders et al. (2001) are used to illustrate the feasibility of the revised method. Finally, a guidance for the usage for testing CNV is provided.

目 錄

1 緒論 1
2 研究方法 7
2.1 第一步驟-分割法 7
2.1.1 二元分割法 8
2.1.2 循環二元分割法. 8
2.1.3 PCF 演算法 9
2.2 第二步驟-檢定法 13
2.2.1 GISTIC 14
2.2.2 Z 檢定 16
2.2.3 符號檢定 16
2.3 第三步驟 18
3 分割與檢定方法的表現 19
3.1 模擬設定 19
3.1.1 分割法 19
3.1.2 GISTIC 20
3.2 分割法模擬結果 21
3.2.1 觀察值間波動大小對分割法的影響 21
3.2.2 變動點間距大小對分割法的影響 25
3.2.3 變動段長度佔比對分割法的影響 28
3.3 GISTIC 模擬結果 32
3.3.1 觀察值間波動對 GISTIC 的影響 32
3.3.2 變動點間距大小對 GISTIC 的影響 33
3.3.3 變動段長度佔比對 GISTIC 的影響 33
4 實例分析 35
4.1 資料集一 36


4.1.1 資料分布 37
4.1.2 分割法比較 40
4.1.3 分割結果 42
4.1.4 GISTIC 檢定結果 45
4.1.5 分析結果 49
4.1.6 三種方法的比較 50
4.2 資料集二 53
4.2.1 資料分布 53
4.2.2 分割結果 56
4.2.3 GISTIC 檢定結果 59
4.2.4 分析結果 60
4.2.5 三種方法的比較 61
4.3 資料集三 62
4.3.1 資料分布 63
4.3.2 分割結果 66
4.3.3 GISTIC 檢定結果 69
4.3.4 分析結果 72
4.3.5 三種方法的比較 73


結論與建議 77
5.1 討論 77
5.2 結論 78
5.2.1 分割法及 GISTIC 78
5.2.2 限制與比較 79
5.3 建議 80

參考文獻 82
附錄 A 85
附錄 B 92






圖目錄


圖 1.1 沒有明顯變動的染色體基因組 (資料來源:Snijders 等人,2001) . . . 2
圖 1.2 有明顯變動的染色體基因組 (資料來源:Snijders 等人,2001) . . . . . 2
圖 1.3 aCGH 的操作流程(資料來源:Smetana 等人, 2011) . . . . . . . . . . 3
圖 1.4 基因組 CNV 分析流程 . . . . . . . . . . . . . . . . . . . . . . . . . . 4
圖 2.1 資料集 (一) -第一條染色體散佈圖 . . . . . . . . . . . . . . . . . . . 12
圖 2.2 比較 PCF (γ = 12) 及兩階段 PCF 在實際資料的分割情況 . . . . . . 12
圖 2.3 GISTIC 對基因組進行評分的過程(資料來源:Beroukhim 等人, 2007) 15
圖 3.1 不同波動下 BS 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . . 21
圖 3.2 不同波動下 CBS 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . 22
圖 3.3 不同波動下 PCF 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . 23
圖 3.4 三種方法在不同波動下的表現 . . . . . . . . . . . . . . . . . . . . . 25
圖 3.5 不同間距下 BS 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . . 26
圖 3.6 不同間距下 CBS 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . 26
圖 3.7 不同間距下 PCF 檢定結果 . . . . . . . . . . . . . . . . . . . . . . . . 27
圖 3.8 三種方法在不同間距下的表現 . . . . . . . . . . . . . . . . . . . . . 28
圖 3.9 不同變動段占比下 BS 檢定結果 . . . . . . . . . . . . . . . . . . . . . 29
圖 3.10 不同變動段占比下 CBS 檢定結果 . . . . . . . . . . . . . . . . . . . 29
圖 3.11 不同變動段占比下 PCF 檢定結果 . . . . . . . . . . . . . . . . . . . 30
圖 3.12 三種方法在不同變動段長度比例下的表現 . . . . . . . . . . . . . . 31
圖 4.1 資料集一 (第 1 條至第 8 條染色體的拷貝數散佈圖) . . . . . . . . . . 37
圖 4.2 資料集一 (第 9 條至第 16 條染色體的拷貝數散佈圖) . . . . . . . . . 38
圖 4.3 資料集一 (第 17 條至第 23 條染色體的拷貝數散佈圖) . . . . . . . . 39

圖 4.4 資料集一—GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . . 46
圖 4.5 資料集二 (第 1 條至第 6 條染色體的拷貝數散佈圖) . . . . . . . . . . 53
圖 4.6 資料集二 (第 7 條至第 14 條染色體的拷貝數散佈圖) . . . . . . . . . 54
圖 4.7 資料集二 (第 15 條至第 22 條染色體的拷貝數散佈圖) . . . . . . . . 55
圖 4.8 資 料 集 二 ( 第 23 條 染 色 體 的 拷 貝 數 散 佈 圖 ) . . . . . . . . . . . . . . 56
圖 4.9 資料集二- GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . . 59
圖 4.10 資料集三 (第 1 條至第 8 條染色體的拷貝數散佈圖) . . . . . . . . . 63
圖 4.11 資料集三 (第 9 條至第 16 條染色體的拷貝數散佈圖) . . . . . . . . 64
圖 4.12 資料集三 (第 17 條至第 23 條染色體的拷貝數散佈圖) . . . . . . . . 65
圖 4.13 資料集三- GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . 70
圖 5.1 三個資料集 GISTIC 檢定結果的比較 . . . . . . . . . . . . . . . . . . 78
圖 5.2 分割法建議使用時機 . . . . . . . . . . . . . . . . . . . . . . . . . . . 81





表目錄


表 2.1 演算法中未引進懲罰項的兩階段 PCF 檢定結果 . . . . . . . . . . . . 13
表 3.1 不同波動對 PCF 分割法的影響 (d = 0.03, p = 7%) . . . . . . . . . . 23
表 3.2 不同波動對 PCF 檢定力的影響 (d = 0.03, p = 33%) . . . . . . . . . . 24
表 3.3 三種方法在不同波動下的表現比較 (d = 0.03, p = 7%) . . . . . . . . 24
表 3.4 三種方法在不同間距下的表現比較 (σ2 = 0.01, p = 37%) . . . . . . . 27
表 3.5 三種方法在不同長度佔比下的表現比較 (d = 0.1, σ2 = 0.01) . . . . . 30
表 3.6 不同波動對 GISTIC 檢定的影響 (d = 0.1, p = 33%) . . . . . . . . . . 32
表 3.7 不同間隔對 GISTIC 檢定的影響 (σ2 = 0.01, p = 33%) . . . . . . . . . 33
表 3.8 不同變動段佔比對 GISTIC 檢定的影響(d = 0.1, σ2 = 0.01) . . . . . 34
表 4.1 資料欄位介紹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
表 4.2 探討不同分割法分割資料集一染色體基因表現的分割結果 . . . . . 40
表 4.3 CBS 及 PCF 分割法的分割片段數量比較 . . . . . . . . . . . . . . . . 41
表 4.4 資料集一分割結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
表 4.5 使 用 剝 離 法 對 資 料 集 一 染 色 體 進 行 分 析 . . . . . . . . . . . . . . . . 48
表 4.6 資料集一-分析結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
表 4.7 資料集一-三種檢定方法不同結果 . . . . . . . . . . . . . . . . . . . 52
表 4.8 資料集二-分割結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
表 4.9 使 用 剝 離 法 對 資 料 集 二 染 色 體 進 行 分 析 . . . . . . . . . . . . . . . . 60
表 4.10 資料集二-分析結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 61
表 4.11 資料集二-三種檢定方法不同結果 . . . . . . . . . . . . . . . . . . 62
表 4.12 資料集三-分割結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 67
表 4.13 使用剝離法對資料集三染色體進行分析 . . . . . . . . . . . . . . . 71
表 4.14 資料集三-分析結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 73

表 4.15 資 料 集 三 - 三 種 檢 定 方 法 不 同 結 果 -1 . . . . . . . . . . . . . . . . . 74
表 4.16 資 料 集 三 - 三 種 檢 定 方 法 不 同 結 果 -2 . . . . . . . . . . . . . . . . . 75
表 A.1 資料集一- GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . . 86
表 A.2 資料集一- GISTIC 檢定結果 (q 值) . . . . . . . . . . . . . . . . . . 87
表 A.3 資料集二- GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . . 88
表 A.4 資料集二- GISTIC 檢定結果 (q 值) . . . . . . . . . . . . . . . . . . 89
表 A.5 資料集三- GISTIC 檢定結果 . . . . . . . . . . . . . . . . . . . . . . 90
表 A.6 資料集三- GISTIC 檢定結果 (q 值) . . . . . . . . . . . . . . . . . . 91
表 B.1 資料集一-三種檢定方法結果比較 . . . . . . . . . . . . . . . . . . . 93
表 B.2 資料集二-三種檢定方法結果比較 . . . . . . . . . . . . . . . . . . . 96
表 B.3 資料集三-三種檢定方法結果比較 . . . . . . . . . . . . . . . . . . . 98

Benjamini Y., & Hochberg Y. (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological), 57(1), 289–300.
Beroukhim R., Getz G., Nghiemphu L., Barretina J., Hsueh T., Linhart D., Vivanco I., Lee J.C., Huang J.H., Alexander S., et al. (2007). Assessing the significance of chromosomal aberrations in cancer: methodology and application to glioma. Proc Natl Acad Sci USA, 104(50), 20007–20012.
Hwang Y.T. (2011). Comparisons of estimators of the number of true null hypotheses and adaptive FDR procedures in multiplicity testing. Journal of Statistical Computation and Simulation, 81(2), 207-220.
Kaveh F., Baumbusch L.O., Nebdal D., Børresen-Dale A.L., Lingjærde O.C., Edvardsen H., Kristensen V.N. & Solvang H.K. (2016). A systematic comparison of copy number alter- ations in four types of female cancer. BMC Cancer, 16, 913.
Nilsen G., Liestol K., Van L.P., Moen Vollan H.K., Eide M.B., Rueda O.M., Chin S.F., Russell R., Baumbusch L.O., Caldas C., et al. (2012). Copynumber: Efficient algorithms for single- and multi- track copy number segmentation. BMC Genomics, 13(1), 591.
Olshen A.B., Venkatraman E.S., Lucito R., & Wigler M. (2004). Circular binary segmenta- tion for the analysis of array-based copy number data. Biostatistics, 5(4), 557–572.
Sanchez G.F., Akavia U.D., Mozes E., & Pe’er D. (2010). JISTIC: identification of signifi- cant targets in cancer. BMC Bioinformatics, 11, 189.
Sen A. & Srivastava M. S. (1975). On tests for detecting a change in mean. Annals of Statistics, 3(1), 98–108.
Smetana, J., Fröhlich, J., Vranová, V., Mikulášová, A., Kuglík, P., & Hájek, R. (2011). Oligonucleotide-based array CGH as a diagnostic tool in multiple myeloma patients. Klin Onkol, 24(Suppl), S43-S48.
Snijders A.M., Nowak N.J., Segraves R., Blackwood S., Brown N., Conroy J., Hamilton G., Hindle A.K., Huey B. , Kimura K., et al. (2001). Assembly of microarrays for genome-wide measurement of DNA copy number. Nature Genetics, 29(3), 263-264.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔