跳到主要內容

臺灣博碩士論文加值系統

(34.226.244.254) 您好!臺灣時間:2021/08/03 03:29
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:王麗淑
研究生(外文):Li-Shu Wang
論文名稱:以分群方法進行疾病相關基因的探勘
論文名稱(外文):Data Mining of Disease Susceptibility Genes Using Clustering Methods
指導教授:戴政戴政引用關係侯家鼎侯家鼎引用關係
指導教授(外文):John Jen TaiChia-Ding Hou
學位類別:碩士
校院名稱:輔仁大學
系所名稱:應用統計學研究所
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:58
中文關鍵詞:病體對照資料資料探勘集群分析K組平均數法
外文關鍵詞:Case-control dataData miningCluster analysisK-means method
相關次數:
  • 被引用被引用:1
  • 點閱點閱:108
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
隨著快速基因體定序的來臨,資料探勘已經成為搜尋疾病基因的一項利器之一。在實務上集群分析是一個從數以千計的標識基因中找出疾病易感受基因的快速簡便的方法。在本研究中利用集群分析將標識基因分類成高相關群與低相關群兩群,高相關群為與疾病基因具有高度相關之標識基因,而無相關群為與疾病基因相關程度較低之標識基因。集群分析利用由病體對照資料中所獲得之P值當做衡量距離,本研究為利用P值做為集群分析中衡量的相對距離之初步研究。模擬結果顯示在某些情況下(如當連鎖所不平衡係數高時),利用分群可以正確的找出疾病基因。
With the advent of modern rapid genome sequencing, data mining has become one of the most efficient instruments for searching the possible genes underlying the susceptibility to diseases in these days. To search for the disease susceptibility genes from thousands of available markers, clustering methods provides a time-saving way to make the search process feasible in practical analysis. In this thesis we propose a clustering method to classify the tested markers into two groups, the associated group and non-associated group. Members in the associated group are the markers that have higher association with the disease than those in non-associated group. P-values obtained from case-control data are used as the genetic distance for clustering process. Simulation studies were conducted to investigate the performance of our method. Our study is a preliminary investigation on the possibility of use of P-values as the genetic distance for clustering. The results showed that in some simulations (e.g., when linkage disequilibrium is high) our method can correctly identify the genes of diseases.
目 錄 I
表 次 II
圖 次 III
第一章 緒論 1
第一節 研究背景 1
第二節 研究動機與目的 2
第三節 論文架構 3
第二章 文獻探討 4
第一節 相關分析 4
第二節 資料探勘簡介 5
第三節 資料探勘在生物資訊上的應用 7
第三章 研究方法 9
第一節 參數介紹 9
第二節 趨勢檢定 11
第三節 集群分析 14
第四章 資料模擬與分析 18
第一節 資料模擬架構 18
第二節 模擬結果 20
第五章 結論與建議 38
參考文獻 40
附錄A 各模式下之平均分群正確率變動圖 42
附錄B 模擬情境一之四種遺傳模式下平均分群正確率 45
附錄C Fortran 程式碼 49
中文文獻
戴 政,「遺傳流行病學」,台北市:藝軒圖書出版社,2002年。

英文文獻
Agresti, A. (2002) Categorical data analysis, New York: A Wiley-Interscience Publication, John Wiley & Sons, Inc.
Armitage P. (1955) Test for linear trends in proportions and frequencies, Biometrics, 11, pp. 375-386.
Berry M. J. A., and Linoff G. S. (2000) Data Mining Techniques For Marketing, Sales, and Customer Support , New York: John Wiley & Sons, Inc.
Fayyad V. Piatetsky-Shapiro G., and Smyth P. Uthurusamy R. (1996) Advances in Knowledge Discovery and Data Mining, Cambridge, MA: The MIT Press,.
Gibbons F. D.,and Roth F. P.,( 2002) Judging the quality of gene expression-based clustering methods using gene annotation, Genome Res., 12, pp. 1574-1581.
Han J., and Kamber M., (2001) Date Mining Concepts and Techniques, New Work: Morgan-Kaufman.
International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the human genome, Nature, 431, pp. 931-945.
J. B. MacQueen (1967) Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1, pp. 281-297.
Levenstien M. A., Yang Y., and Ott J., (2003) Statistical significance for hierarchical clustering in genetic association and microarray expression studies, BMC Bioinformatics, 4: 62.
Risch N., and Merikangas K. (1996) The future of genetic studies of complex human diseases, Science, 273, pp. 1516-1517.
Tou JT., and Gonzalez RC. (1974), Pattern recognition principles, Massachusetts (MA): Addison-Wesley.
Zheng G., Freidlin B., and Gastwirth J. L., (2002) Robust TDT-type candidate-gene association tests, Annals of Human Geneteics, 66, pp. 145-155.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊