跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.14) 您好!臺灣時間:2025/12/25 17:52
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:林秉鴻
研究生(外文):Bing-Hung Lin
論文名稱:利用山岳刪減群聚法找尋突變熱區
論文名稱(外文):Identification of mutation hotspots using mountain subtractive clustering
指導教授:鍾翊方
指導教授(外文):I-Fang Chung
學位類別:碩士
校院名稱:國立陽明大學
系所名稱:生物醫學資訊研究所
學門:生命科學學門
學類:生物化學學類
論文種類:學術論文
論文出版年:2016
畢業學年度:104
語文別:中文
論文頁數:72
中文關鍵詞:突變熱區山岳刪減群聚法體細胞突變
外文關鍵詞:mutation hotspot regionmountain subtractive clusteringsomatic mutation
相關次數:
  • 被引用被引用:0
  • 點閱點閱:123
  • 評分評分:
  • 下載下載:1
  • 收藏至我的研究室書目清單書目收藏:0
近年來次世代定序技術(Next Generation Sequencing, NGS)中Exome-Seq資料可被有效用於偵測癌症病人身上所發生的體細胞突變(somatic mutation),進而發現有些癌症在基因之特定區域上會有大量的體細胞突變發生,此特定區域被稱為突變熱區(mutation hotspot)。過去幾年已有數個作法被提出而用於偵測突變熱區,並間接指出這些突變熱區可能導致基因功能改變及癌症的生成。
為了有效尋找一個基因上突變熱區,首先本篇同時考慮該基因上有多個樣本支持單一位點上發生突變以及周圍突變位點數量之影響,因此設計一數學模式將位點突變資料轉換成突變密度資訊。接著利用山岳刪減群聚法(Mountain Subtractive Clustering)一一找出該基因上可能當作突變熱區的中心位置。最後再利用該基因上之相鄰突變點間之距離分布資訊來當作篩選條件以確認突變點歸屬於特定熱區狀況。
此處本篇使用TCGA (The Cancer Genome Atlas)之Exome-Seq資料中所提供多種癌症的之體細胞突變資訊,目前初步結果顯示所提出的作法確實可找到一個基因上之突變熱點。未來將進一步賦予每個突變熱區p-value資訊並與其他作法做進一步比較(如:所找到突變熱區的位置與範圍,以及擁有的突變數量),再則將探討所找到突變熱區與生物機能之關聯性。

Over the past few years, Exome sequencing (Exome-Seq) data, one kind of next-generation sequencing applications, has been especially effective for detecting gene somatic mutation events of cancer patients. Furthermore, for some cancers large amounts of somatic mutations have been observed to appear in specific regions of some genes, called mutation hotspots. In addition, several computational tools have been developed for identifying such mutation hotspots in genes.
In order to correctly and effectively identify gene mutation hotspots, we adopt the following three strategies for each gene: (1) We design a mathematical model to convert raw mutation counts into mutation density information which integrates the impacts of mutations from a specific position and its neighbors with single/multiple samples supporting. (2) We use the mountain subtractive clustering method to identify the center of every possible mutation hotspot one by one. (3) The distribution information of the distance for all of the adjacent two mutations in a gene is further used to determine which mutations belong to a specific mutation hotspot.
The used somatic mutations are from the TCGA Exome-Seq data. Currently, we have demonstrated that our proposed approach is indeed able to identify the mutation hotspots for a gene. In future, we shall design a method to assign a p-value for each identified mutation hotspot. In addition, our results shall be comprehensively compared with the results of other approaches (e.g., the location and extent of mutation hotspots). Finally, we also plan to investigate the relationship between the mutation hotspots and cancer mechanisms.

目錄
中文摘要 i
英文摘要 ii
目錄 iii
圖目錄 iv
表目錄 vii
第一章 背景介紹 1
1.1癌症與驅動基因 1
1.2癌症基因與其影響性 3
1.3預測突變熱區之方法 5
1.4動機與主旨 10
第二章 材料與方法 11
2.1突變資料 11
2.2資料處理 12
2.3突變熱區之預測 15
2.3.1分數資訊之轉換 16
2.3.2山岳刪減群聚法 17
2.3.3突變熱區之大小 18
2.3.4突變熱區之決定 20
2.3.5 統計檢測 21
第三章 結果與討論 21
3.1預測之突變熱區 21
3.1.1單一癌症之預測 22
3.1.1.1體細胞突變 22
3.1.1.2體細胞突變影響性之影響 29
3.1.1.3生殖細胞突變 36
3.1.1.4生殖細胞突變影響性之影響 40
3.1.1.5體細胞突變資料與生殖細胞突變資料的結合 43
3.1.2泛癌症之預測 54
3.1.2.1體細胞突變 54
3.1.2.2體細胞突變影響性之影響 59
3.2其他工具之比較 64
第四章 結論與今後工作 68
參考 70

圖目錄
圖 1. e-Driver(Porta-Pardo & Godzik, 2014)做法示意圖。 6
圖 2 MSEA(MSEA, Jia et al , 2014)作法示意圖。 7
圖 3 OncodriveCLUST(Tamborero et al., 2013)做法之示意圖 9
圖 4 本篇的做法與流程。 15
圖 5 原始突變資訊轉換成分數之範例圖。 17
圖 6 LUAD癌症上TP53基因上的群中心尋找狀況。 18
圖 7 突變熱區之範圍找尋。 20
圖 8 LUAD、COAD、GBM三種癌症資料做第一次分類(分成致癌基因與腫瘤抑制基因)後之突變熱區經過篩選後的數目。 23
圖 9 TP53基因在三種癌症上所預測之突變熱區。 26
圖 10 只在COAD癌症中找到擁有突變熱區的PIK3CA基因。 27
圖 11 三種癌症分別找出之擁有突變熱區之基因。 28
圖 12 LUAD、COAD、GBM三種癌症資料做第二次分類(將分類成致癌基因與腫瘤抑制基因的資料再進一步對其突變之影響性做分類)後之突變熱區經過篩選後的數目。 30
圖 13 COAD癌症資料經過分類後NRAS基因的結果。 32
圖 14 GBM癌症資料經過分類後HOXD11基因的結果。 33
圖 15 GBM癌症資料經過第二次分類後ALDH2基因的結果。 34
圖 16 三種癌症經過第二次分類後分別找出之擁有突變熱區之基因。 35
圖 17 LUAD癌症生殖細胞突變資料做第一次分類(分成致癌基因與腫瘤抑制基因)後之突變熱區經過篩選後的數目。 36
圖 18 LUAD癌症生殖細胞突變FAT1基因的結果。 37
圖 19 LUAD癌症體細胞突變與生殖細胞突變資料擁有相同KRAS基因的結果。 38
圖 20 為LUAD生殖細胞突變資料所預測有突變熱區的基因。 39
圖 21 為LUAD生殖細胞突變資料經過第二次分類後之突變熱區經過篩選後的數目。 40
圖 22 LUAD癌症生殖細胞突變資料第二次分類前後突變熱區有改變IDH1基因的結果。 42
圖 23 LUAD癌症生殖細胞突變資料經過第二次分類後所預測有突變熱區的基因。 43
圖 24 LUAD癌症合併資料之突變熱區經過篩選的數目。 44
圖 25 LUAD癌症資料經合併與沒有合併之TP53基因上突變熱區分析結果。 46
圖 26 LUAD癌症資料經合併與沒有合併之ABL1基因上突變熱區分析結果。 47
圖 27 LUAD癌症資料經合併與沒有合併之BRAF基因上突變熱區分析結果。 49
圖 28 LUAD合併資料找出之擁有突變熱區之基因。 49
圖 29 LUAD癌症之合併資料中突變熱區經過篩選的數目。 50
圖 30 LUAD癌症合併資料第二次分類的前後之CTNNB1基因上突變熱區分析結果。 52
圖 31 LUAD癌症合併資料經過第二次分類後分別找出之擁有突變熱區之基因。 53
圖 32 泛癌症經第一次分類後突變熱區經過篩選的數目。 54
圖 33 泛癌症資料中RBM10基因有疊加突變形成的突變熱區。 56
圖 34 泛癌症與單一癌症的突變熱區比較。 58
圖 35 泛癌症找出之擁有突變熱區之基因。 59
圖 36 泛癌症經第二次分類後突變熱區經過篩選的數目。 60
圖 37 泛癌症第二次分類前後的STAT3基因上的突變熱區比較。 62
圖 38 泛癌症第二次分類前後的NAB2基因上的突變熱區比較。 62
圖 39 泛癌症資料經過第二次分類後找出之擁有突變熱區之基因。 63
圖 40 至少被三種工具偵測到有突變熱區之基因。 66
圖 41 LUAD資料中IDH1基因上的突變資訊。 66
圖 42 COAD癌症資料中ARID1A基因上的突變熱區經過費雪精確檢定之突變熱區較OncodriveCLUST工具的結果有意義。 67

表目錄
表1 本篇研究所用之癌症種類的病患人數和突變數量 11
表2 11種癌症經過篩選後有擁有之突變資訊。 13
表3 LUAD、COAD、GBM三種癌症之突變熱區經篩選後之突變熱區數目 24
表4 三個癌症突變資訊經過第二次分類後的分析結果。 30
表5 LUAD癌症生殖細胞突變資料的分析結果。 36
表6 LUAD癌症生殖細胞突變資料經第二次分類後的分析結果 41
表7 LUAD癌症結合資料的分析結果 44
表8 LUAD癌症資料與結合資料之突變影響性與同義非同義突變數目。 50
表9 LUAD癌症結合資料經第二次分類的分析結果。 51
表10 泛癌症突變資訊的分析結果 55
表11 泛癌症中經過第二次分類後的分析結果。 60


參考
Ana I. Robles, Curtis C. Harris (2010). Clinical outcomes and correlates of TP53 mutations and cancer. Cold Spring Harb Perspect Biol, 2(3): a001016.

B Hoffman, D ALiebermann. (2008). Apoptotic signaling by c-MYC. Oncogene, 27:6462-6472.

Balog, E. R., 1., Burke, J. R., Hura, G. L., Rubin, S. M.(2011). Crystal structure of the unliganded retinoblastoma protein pocket domain. Proteins, 79(6): 2010-2014.

Cancer Genome Atlas Research Network.(2008) Comprehensive genomic characterization defines human glioblastoma genes and core pathways. Nature, 455(7216):1061-1068.

Cingolani P, Platts A, Wang le L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM (2012). A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. FLY, 6(2):80-92.

David A. Foster, Paige Yellen, Limei Xu, Mahesh Saqcena. (2010). Regulation of G1 cell cycle progression. Genes Cancer, 1(11): 1124–1131.

David Tamborero, Abel Gonzalez-Perez, and Nuria Lopez-Bigas(2013). OncodriveCLUST: exploiting the positional clustering of somatic mutations to identify cancer genes. Bioinformatics original, 29(18): 2238–2244.

Eduard Porta-Pardo, Adam Godzik (2014). e-Driver: A novel method to identify protein regions driving cancer.Bioinformatics.

Giovanni Ciriello, Martin L Miller, Bülent Arman Aksoy, Yasin Senbabaoglu, Nikolaus Schultz& Chris Sander.(2013). Emerging landscape of oncogenic signatures across human cancers. Nature Genetics,45: 1127-1133.

Greenman C, Stephens P, Smith R, Dalgliesh GL, Hunter C, Bignell G, Davies H, Teague J, Butler A, Stevens C et al.(2007) Patterns of somatic mutation in human cancer genomes. Nature , 446(7132):153-158.

Harvey, L., Arnold, B., Chris, A. K., Monty, K., Matthew, P. S., Anthony, B., Hidde, P., & Paul, M.(2007). Molecular cell biology. Sixth Edition. W. H. Freeman and Company.

Jane, B. R., Lisa, A. U., Michael, L. C., Steven, A. W., Peter, V. M., & Robert, B. J.(2011). CAMPBELL BIOLOGY. Ninth Edition. San Francisco: Pearson Education, Inc.

Liu LP, Hu BG, Ye C, Ho RL, Chen GG, Lai PB (2014). HBx mutants differentially affect the activation of hypoxia-inducible factor-1a in hepatocellular carcinoma. British Journal of Cancer, 110(4): 1066-1073.

McClean, Phillip.(1999)."Types of Mutations".Genes and Mutations.Course material from PLSC 431/631 - Intermediate Genetics.

McLaren W,Pritchard B,Rios D,Chen Y,Flicek P,Cunningham F (2010). Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor.Bioinformatics, 26(16):2069-70.

Nikhil R. Pal & Debrup Chakraborty (2000). Mountain and Subtractive Clustering Method: Improvements and Generalizations. International Journal of Intelligent Systems, 15(4):329-341.

Peilin Jia, Quan Wang, Qingxia Chen, Katherine E Hutchinson, William Pao and Zhongming Zhao (2014). MSEA: detection and quantification of mutation hotspots through mutation set enrichment analysis. Genome Biology, 15: 489.

Prior IA, Lewis PD, Mattos C.(2012). A comprehensive survey of Ras mutations in cancer. Cancer research. 72(10):2457-2467.

Ramirez-Ardila DE, Helmijr JC, Look MP, Lurkin I, Ruigrok-Ritstier K, van Laere S, Dirix L, Sweep FC, Span PN, Linn SC, Foekens JA, Sleijfer S, Berns EM, Jansen MP.(2013). Hotspot mutations in PIK3CA associate with first-line treatment outcome for aromatase inhibitors but not for tamoxifen. Breast Cancer Res Treat, 139:39–49.

Rivlin N, Brosh R, Oren M, Rotter V (2011). Mutations in the p53 tumor suppressor gene: important milestones at the various steps of tumorigenesis. Genes Cancer, 2:466–474.

S Bamford, E Dawson, S Forbes, J Clements, R Pettett, A Dogan, A Flanagan, J Teague, P A Futreal, M R Stratton, and R Wooster.(2004). British Journal of Cancer. 91(2): 355-358.

Salvador JM, Brown-Clay JD, Fornace AJ Jr. (2013). Gadd45 in stress signaling, cell cycle control, and apoptosis. Advances in Experimental Medicine and Biology, 793:1-19.

Samy Lamouille, Jian Xu, Rik Derynck. (2014). Molecular mechanisms of epithelial–mesenchymal transition. Nature Reviews Molecular Cell Biology, 15:178–196

Sherr, C. J.(2004). Principles of tumor suppression. Cell, 116 (2): 235–246.

Smith LE, Denissenko MF,Bennett WP, Li H,Amin S, Tang M,Pfeifer GP (2000). Targeting of Lung Cancer Mutational Hotspots by Polycyclic Aromatic Hydrocarbons. Journal of the national cancer institute, 92(10): 803-811.

Travis I Zack, Steven E Schumacher, Scott L Carter, Andrew D Cherniack, Gordon Saksena, Barbara Tabak, Michael S Lawrence, Cheng-Zhong Zhang, Jeremiah Wala, Craig H Mermel, Carrie Sougnez, Stacey B Gabriel, Bryan Hernandez, Hui Shen , Peter W Laird, Gad Getz, Matthew Meyerson& Rameen Beroukhim.(2013) Pan-cancer patterns of somatic copy number alteration. Nature Genetics. 45: 1134-1140.

Zecchin D, Boscaro V, Medico E, Barault L, Martini M, Arena S, Cancelliere C, Bartolini A, Crowley EH, Bardelli A et al.(2013) BRAF V600E is a determinant of sensitivity to proteasome inhibitors. Molecular cancer therapeutics, 12(12):2950-2961.

連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top