(3.230.76.48) 您好!臺灣時間:2021/04/12 16:07
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:黃彥博
研究生(外文):Huang Yen Po
論文名稱:智慧型混合系統應用於卵巢癌之微陣列基因篩選與分類
論文名稱(外文):An Intelligent Hybrid System Applied to Gene Selection and Classification for Ovarian Cancer Microarray Data
指導教授:李仁鐘;許成之
學位類別:碩士
校院名稱:華梵大學
系所名稱:資訊管理學系碩士班
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:68
中文關鍵詞:微陣列卵巢癌
外文關鍵詞:MicroarrayOvarian Cancer
相關次數:
  • 被引用被引用:9
  • 點閱點閱:400
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:82
  • 收藏至我的研究室書目清單書目收藏:0
由於科技進步,生物晶片技術越來越成熟,製造成本也隨時間而降低,使得我們能夠更容易的取得更多的基因資料。但是微陣列(Microarray)之資料型態,不同於一般統計分析之資料,其變數多達成千上萬個(視晶片大小而定)且樣本數也不多,所以在本研究中,我們希望能找出一個可行的方法,對於Microarray Data的基因選取與分類,有著更好的效果。在取得Microarray的基因資料之後,將初始資料先進行迴歸分析,利用迴歸分析,以降低其維度(9600),並選出殘差最大與最小各100組之基因資料,標定為目標基因。
將目標基因以基因演算法結合支持向量機演算法進行篩選,標定出可以有效分類癌症的基因,並將幾組不同適應值(Fitness)值所找出的具有分類能力的基因進行整合。再把整合之後的結果結果進行ANOVA檢定來選出分類中對癌症/腫瘤類型有明顯區分能力之特徵基因。將此結果利用FCM方法和Hierarchical Clustering方法來進行測試,判斷是否能有效區分出癌症/腫瘤之致病基因。最後將幾組不同ANOVA信賴區間所找到的結果進行分析與比較,並找出最少的基因組數,和最高的分類正確率。在本研究中,最後在有特殊子類型的分類情況下得到最好的分類正確率,並找到最少的9組特徵基因。
Due to the vigorous development of bioinformatics technology, biochip is more matured and the production cost is decreased significantly. Thus, it is easy to access gene data. However, the data type of microarray is different from the usually statistical data. A typical microarray data of ovarian cancer consists of the expressions of tens of thousands of genes on a genomic scale. In this thesis, a proper approach with reasonable efficiency is developed to analyze the microarray data.
In this thesis, it begins with the regression analysis after getting the microarray data. The regression analysis is to select the target genes by picking the 200 genes with the highest or lowest residuals. For support vector machine (SVM) and genetic algorithm (GA), those target genes are furthermore selected as the disease-linked genes. Then several disease-linked genes are found according to various fitness values. Additionally, analysis of variance (ANOVA) is used to find the genes that have the ability to isolate these genes which relate to ovarian cancer. Then, fuzzy c-means (FCM) and hierarchical clustering are conducted to classify ovarian cancer. Finally the accuracy of classification is used to find the least disease-linked genes with the best performance. These obtained disease-linked genes can be used to classify ovarian cancer.
目錄
致謝 Ⅰ
摘要 Ⅱ
Abstract Ⅲ
目錄 Ⅳ
表錄 Ⅵ
圖錄 Ⅶ
一、緒論 1
1.1 研究背景 1
1.2 研究動機與目的 2
1.3 研究限制與研究範圍 4
二、文獻探討 6
2.1 生物資訊 6
2.2 Microarray Data資料相關研究 9
2.3 迴歸分析(Regression Analysis) 10
2.4 基因演算法(Genetic Algorithm, GA) 11
2.5 支持向量機演算法(Support Vector Machines, SVMs) 13
2.6 ANOVA 17
2.7 FCM(Fuzzy C-Means) 17
2.8 Hierarchical Clustering 19
三、研究方法 21
3.1 研究設計 21
3.2 卵巢癌Microarray資料 22
3.3 研究參數設定 23
3.3.1 基因演算法參數設定 23
3.3.2 支持向量機演算法與Hierarchical Clustering的參數設定 27
四、研究結果 29
4.1 分為三種資料型態研究結果 31
4.2 分為四種資料型態研究結果 36
4.3 結果比較 42
4.4 結果討論 49
五、結論 52
參考文獻 53
附錄 59
參考文獻
[1] 陳健尉,「生物晶片在生物醫學上之應用」,國立中興大學農業暨自然資源學院/國立中興大學生物科技發展中心/教育部植物生物技術教學資源中心,生物科技新知研習會,國立中興大學,台中市,民國九十三年八月十九日至二十日。
[2] 陳健尉,「生物晶片之生技應用」,國立中興大學生物科技發展中心/國家科學委員會,台灣生物科技產學論壇,國立中興大學,台中市,民國九十二年十二月四日。
[3] 李炎編著,基礎生物資訊,藝軒出版社,台北,民國九十一年。
[4] 張雅芳,黃正仲,「微陣列生物科技」,科學發展月刊,第三十八期,第34-41頁,民國九十三年。
[5] 呂榮銘,「生物晶片(Biochips)的技術發展現況(全文)」,化工資訊月刊,化工所產資組,第十四卷第四期,民國八十九年四月 。
[6] 周鵬程編著,遺傳演算法原理與應用-活用Matlab,全華出版社,台北,民國九十四年。
[7] 莊麗月,楊正宏,杜崇睿,張學偉,「GA-PSO用於基因表現資料的特徵選取」,2006數位科技與創新管理國際研討會,華梵大學,台北縣,民國九十五年。
[8] 王景南,「多類支持向量機之研究」,元智大學資訊管理學系碩士論文,民國九十二年六月。
[9] 游源惠,黃建軒,「導入SVM之棋類人工智慧-以四連環遊戲為例」,2006數位科技與創新管理國際研討會,華梵大學,台北縣,民國九十五年。
[10]林正淇,「多方法分析探索B細胞淋巴瘤之基因表現型態」,雲林科技大學資訊管理學系碩士論文,民國九十一年六月。
[11]蔡孟勳,盧信智,「以混合式模糊法分析基因晶片之資料集」,第12屆模糊理論及其應用會議,宜蘭大學,宜蘭縣,民國九十三年。
[12]顏勝茂,「利用基因演算法建構演化樹之分析」,中華大學資訊工程學系碩士論文,民國九十四年六月。
[13]張育政,「結合約略集合理論與基因演算法於支持向量機」,中華大學資訊管理學系碩士論文,民國九十四年六月。
[14]盧信智,「應用卵巢癌之微陣列晶片分析基因表現量及調控路徑」,國立台灣大學電機工程系碩士論文,民國九十五年六月。
[15]趙嘉煌,「特徵選取在微陣列基因表現資料之應用」,國立台灣科技大學資訊工程系論文,民國九十三年六月。
[16]潘麒全,「可修正的二分群集法」,中原大學資訊管理學系碩士,民國九十二年六月。
[17]Jin-Tsong Teng, and Tsu-Tian Lee, “Classification of Ovarian cancer based on Intelligent systems with Microarry data,”2005 IEEE International Conference on System, Man and Cybernetics, pp. 1053-1058, 2005.
[18]G.-S Huang, “Microarray Analysis of Ovarian Cancer,” 2005 IEEE International Conference on System, Man and Cybernetics, 2005.
[19]Cortes, C., and Vapnik, V., “Support Vector Network,” Machine Learning, Vol.20, pp. 273-297, 1995.
[20]Burges,C.J.C., “A tutorial on support vector machine for pattern recognition,” Data mining and Knowledge Discovery, Vol.2, No.2, pp. 121-167, June 1998.
[21]Zimmermann, J. J., Fuzzy Set Theory and Its Applications, Kluwer Academi, Boston, 1991.
[22]V. N. Vapnik, The Nature of Statistical Learning Theory, Springer-Verlag, New York, 1995.
[23]Cheng-Lung Huang, and Chieh-Jen Wang, “A GA-based feature selection and parameters optimization for support vector machines,” Expert Systems with Applications, March 2006, pp. 231-240.
[24]Te-Ming Huang, and Vojislav Kecman “Gene extraction for cancer diagnosis by support vector machines -- An improvement,” Artifical Intelligence in Medicine, vol.35, pp.185-194, 2005
[25]Krzysztof Simek, Krzysztof Fujarewicz, Andrzej Swierniak, Marek Kimmel, Barbara Jarzab, Malgorzata Wiench, and Joanna Rzeszowska“Using SVD and SVM methods for selection, classification, clustering and modeling of DNA microarray data,” Engineering Applications of Artificial Intelligence, vol.17, pp.417-427, 2004.
[26]DeRisi J, Penland L, Brown PO, Bittner ML, Meltzer PS, Ray M, Chen Y, Su YA, and Trent JM, “Use of a cDNA microarray to analyze gene expression patterns in human cancer,” Nature Genet, vol 14, pp.457-460, 1996.
[27]DeRisi JL, Iyer VR and Brown PO, “Exploring the metabolic and genetic control of gene expression on a genomic scale,” Science No.278, pp.680-686, 1997.
[28]Schena M, Shalon D, Davis RW and Brown PO “Quantitative monitoring of gene expression patterns with a complementary DNA microarray,” Science 270, pp.467-470, 1995.
[29]Peck K, Stryer L, Glazer AN and Mathies RA “Single-molecule fluorescence detection: autocorrelation criterion and experimental realization with phycoerythrin,” Proc. Natl. Acad, Sci. USA 86, pp.4087-4091, 1989.
[30]Glazer AN, Peck K and Mathies RA “A stable double-stranded DNA-ethidium homodimer complex: application to picogram fluorescence detection of DNA in agarose gels,” Proc. Natl. Acad. Sci. USA 87, pp.3851-3855, 1990.
[31]Velculescu VE, Z. L., Vogelstein B and Kinzler KW “Serial analysis of gene expression,” Science 270, pp.484-487, 1995.
[32]Zhang L, Zhou W, Velculescu VE, Kern SE, Hruban RH, Hamilton SR, Vogelstein B and Kinzler KW “Gene expression profiles in normal and cancer cells,” Science 276, pp.1268-1272, 1997.
[33]Fodor SPA“Massively parallel genomics,” Science 277, pp.393-395, 1997.
[34]Fodor SPA, Read JL, Pirrung MC, Stryer L, Lu AT and Solas D, “Light-directed, spatially addressable parallel chemical synthesis,” Science 251, pp.767-773, 1991.
[35]Fodor SPA, Rava RP, Huang XC, Pease AC, Holmes CP and Adams CL, “Multiplexed biochemical assays with biological chips,” Nature 364, pp.555-556, 1993.
[36]C.-C. Chuang, “Dimension Reduction with Support Vector Regression for Ovarian Cancer Microarray Data,” 2005 IEEE International Conference on System, Man and Cybernetics, 2005.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔