跳到主要內容

臺灣博碩士論文加值系統

(18.204.48.64) 您好!臺灣時間:2021/08/03 12:37
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:洪蜚鴻
研究生(外文):Fei-Hung Hung
論文名稱:建立一個基於機器學習方法的蛋白質交互作用預測系統
論文名稱(外文):Building a Protein-Protein Interaction Prediction System based on Machine Learning Methods
指導教授:邱泓文邱泓文引用關係
指導教授(外文):Hung-Wen Chiu
學位類別:碩士
校院名稱:臺北醫學大學
系所名稱:醫學資訊研究所
學門:醫藥衛生學門
學類:醫學技術及檢驗學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:92
中文關鍵詞:蛋白質交互作用生物學研究電腦運算技術關聯法則探勘預測
外文關鍵詞:Protein-protein interactionBiological researchComputational methodsAssociation rule miningPredictionIn-silico
相關次數:
  • 被引用被引用:0
  • 點閱點閱:196
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
簡介:
「蛋白質交互作用」近年來一直是生物學研究中十分重要的環節之一,與生命維持的各項反應息息相關,尤其近幾年大量產生蛋白質交互作用資訊的方法進步的催化下,更使得蛋白質研究領域的研究者有了十分充裕的資訊及輔助工具,在資訊量這麼龐大的現在,運用電腦運算技術能否預測蛋白質交互作用成了最重要的課題。在每一個蛋白質上與其它蛋白質產生反應的區域統稱功能區域 (Functional region,意指Domain、Motif……等),這些功能區域扮演著在交互作用上重要的角色,這些「功能區域─功能區域」的組合直接或間接導致了蛋白質的交互作用。電腦運算的資料探勘技術已廣泛運用於生物資訊領域,這項技術的應用將可讓我們瞭解生物反應裡各元件彼此的關聯性,曾有團隊以關聯法則探勘進行蛋白質交互作用的預測,但是在支持度以及信心值並沒有一個較良好的取捨,也沒有做驗證的步驟。所以,本研究的目的在於應用機器學習方法來建立一個蛋白質交互作用的預測系統。


材料與方法:
本研究所用的蛋白質交互作用資料由DIP、IntAct及BIND等網站收集而來,並參照NCBI等網站之資料將之整合成為同一個資料集並且建置資料庫,本研究需要收集UNIPROT的功能區域的資料集並與蛋白質的資料表中相關聯連的蛋白質紀錄結合,紀錄表單於資料庫中。並篩選出可能使得蛋白質產生反應的Motif Pairs (「功能區域─功能區域」的組合)名單,運用此名單去預測一對蛋白質是否會產生交互作用。本研究應用關聯法則探勘(Association Rule Mining),使用三種物種的蛋白質交互作用資料來進行關係模組的產生,結果的預測模組運用其他物種的蛋白質交互作用進行驗證,並也將與其他預測工具(如InterDom)進行結果比對,依此建立ㄧ個蛋白質交互作用預測系統。

研究結果:
建立ㄧ蛋白質交互作用之預測模組,建立ㄧ個網頁介面的系統,未來上線後將提供如蛋白質整合資訊查詢、蛋白質交互作用查詢、蛋白質功能域及序列比對、本研究產生規則及其符合的蛋白質列表和蛋白質交互作用預測等功能,相關研究可運用本系統取得整合式的蛋白質交互作用資訊,對照提供的功能域資訊,可以輕易看出功能域與交互作用之間其中的關聯性,而預測模組也可提供研究的新方向及參考。
INTRODUCTION
Protein-protein interaction (PPI) is an emerging field in biological research and plays an important role in life process. If PPI prediction can be achieved, scientists will know biological processes and disease mechanisms better. Recently many PPI-related databases were produced. Besides, computational methods were applied to predict PPIs. Because functional regions, e.g. domains, motifs, are key components on whether one protein interact with another protein, several researches had attempted to use data mining methods to show the relationship of functional regions of proteins in PPIs without validation.

MATERIALS AND METHODS
In this study, PPI data were collected from DIP, IntAct and BIND, and the information of functional regions was downloaded from UNIPROT. These data were integrated into one database and its query interface was designed to present protein-protein interaction data including functional regions and sequences. This module for PPIs prediction based on an association rules mining was developed with three sets of PPI data and the PPIs in other species are used to evaluate our PPI prediction module. These rules were compared with the result of InterDom. Finally a system for PPI prediction was constructed with the module.

RESULT
A PPI prediction module was produced for a web-based system. The system will support queries for integrated protein information, protein-protein interaction information, the comparison between functional regions and sequences of proteins. Besides, the system can show those rules matched PPIs and those PPIs matched rules and give a PPI prediction function. Other related researches will be able to get integrated protein-protein interaction information and compare the functional regions by our system. The results of prediction will provide new references.
標 題 ii
審定書 iii
授權書 iv
誌 謝 v
目 錄 vi
圖目錄 viii
表目錄 x
論文摘要 xi
Abstract xiii
第一章 序 論 1
1.1 前 言 1
1.2 研究動機 2
1.3 研究目的 3
第二章 文獻探討 4
2.1 資料庫探討 4
2.1.1 蛋白質相關資料庫 4
2.1.2 蛋白質間交互作用預測資料庫 5
2.2 預測蛋白質間交互作用的電腦運算方法 10
2.2.1 Homology Method 10
2.2.2 羅賽塔石法 (Rosetta Stone) 10
2.2.3 資料探勘 (Data Mining) 11
第三章 材料、方法與架構 13
3.1 資料收集、前置作業與處理 13
3.2 流程與系統架構 20
3.3 方 法 23
3.3.1 統合蛋白質及其功能區域資料 23
3.3.2 建立Motif Pairs資料表 23
3.3.3 資料庫 25
3.3.4 蛋白質功能區域對比率統計 29
3.3.5 關連法則探勘 (Association Rule Mining) 30
3.3.6 ARView 32
3.4 關聯法則探勘之實作及驗證 33
3.4.1. 關聯法則之實作1 (以Field研究室之Yeast PPI資料為輸入) 33
3.4.2. 關聯法則之實作2
(以DIP及IntAct收集整合之Yeast PPI資料為輸入) 34
3.4.3. 關聯法則之實作3
(以較低等物種建立模組,以較高等物種進行驗證) 35
3.4.4. 驗 證 36
第四章 研究結果 37
4.1 查詢功能 38
4.1.1 查詢單一蛋白質之交互作用功能 38
4.1.2 查詢兩個蛋白質交互作用功能 40
4.1.3 查詢本系統具有實際蛋白值交互作用支持的規則 42
4.1.4 查詢本系統中被本研究產生的規則所對應的實際蛋白值交互作用 44
4.2. 驗 證 46
4.2.1. 比率預測之驗證 46
4.2.2. 關聯方法之建立1所產生的預測模組之驗證 49
4.2.3. 關聯方法之建立2所產生的預測模之驗證 53
4.2.4. 關聯方法之建立3所產生的預測模組之驗證 56
4.3. 蛋白質交互作用預測功能 58
4.4. 系統網站之其他部分 60
第五章 討論與未來研究方向 61
5.1. 討 論 61
5.2. 結 論 65
5.3. 未來研究方向 66
參考資料 67
中文文獻 67
英文文獻 67
電子資料 70
附 錄 72
附錄一. 由UNIPROT的Flat File抓取所需的功能區域 72
附錄二. 將單一物種的UNIPROT資料取出 74
附錄三. 將物種PPI存入資料庫 75
附錄四. 取得蛋白質Short Name 76
附錄五. 配對蛋白質以及相對應的功能區域 78
中文文獻
李政儒,〈蛋白質功能域相互作用的預測〉,亞洲大學生物資訊研究所,碩士論文,民95.1.

陳宏助,〈利用蛋白質結構中的功能區域交互作用推測蛋白質交互作用〉,國立交通大學生物資訊所,碩士論文,民94.7.

楊奇,〈利用蛋白質序列與結構的排列方法去預測蛋白質的功能〉,中華大學資訊工程學系碩士班,碩士論文,民94.7.

英文文獻
Bader GD. and Hogue CWV., “An automated method for finding molecular complexes in large protein interaction networks”, BMC Bioinformatics, 2003, Vol. 4(1):2.
Cesareni G., Ceol A., Gavrila C. et al., “Comparative interactomics”, FEBS Letters, 2005, Vol. 579, pp. 1828– 1833.

Deng MH., Mehta S., Sun FZ. et al., “Inferring Domain-Domain Interactions From Protein-Protein Interactions”, Genome Research, 2002, Vol. 10, pp. 1540- 1548.

Han DS., Kim HS., Seo JM. et al., “A Domain Combination Based Probabilistic Framework for Protein-Protein Interaction Prediction”, Genome Informatics, 2003, Vol. 14, pp. 250-259.

Han DS., Kim HS., Jang WH. et al., “PreSPI: Design and Implementation of Protein-Protein Interaction Prediction Service System”, Genome Informatics, 2004, Vol. 15(2), pp. 171-180.

Horng JT., Huang HD., Wang SH. et al., ”Computing Motif Correlations in Proteins”, Comput Chem, 2003, Vol. 24, pp. 2032-2043.

Hu Z., Mellor J., Wu J. et al., “VisANT: an online visualization and analysis tool for biological interaction data”, BMC Bioinformatics, 2004, Vol. 5,pp. 17-24.

Ito T., Chiba T., Ozawa R. et al., “A comprehensive two-hybrid analysis to explore the yeast protein interactome”, Proc. Natl. Acad. Sci., 2001, Vol. 98, pp.4569-4574.

Kocatas A., Gursoy A., Atalay R., “Application of Data Mining Techniques to Protein-Protein Interaction Prediction”, Springer, LNCS, 2003, Vol. 2869, pp. 316-323

Li XL., Tan SH., Ng SK. et al., “Interaction Graph Mining for Protein Complexes Using Local Clique Merging”, Genome Informatics, 2005, Vol. 16(2), pp.260-269.

Marcotte EM., Pellegrini M., Ng HL. et al., Detecting Protein Function and Protein-Protein Interactions from Genome Sequences, SCIENCE, 1999, Vol. 285, pp. 751-753.

Ng SK., Zhang Z., Tan SH. et al.,” InterDom: a database of putative interacting protein domains for validating predicted protein interactions and complexes”, Nucleic Acids Research, 2003, Vol. 31(1), pp. 251-254.

Pitre S., Dehne F. et al., “PIPE: a protein-protein interaction prediction engine based on the re-occurring short polypeptide sequences between known interacting protein pairs”, BMC Bioinformatics, 2006, Vol. 7, pp. 365-379.

Scott MS. and Barton GJ., “Probabilistic prediction and ranking of human protein-protein interactions”, BMC Bioinformatics, 2007, Vol. 8, pp. 239.

Segal E., Wang H., Koller D. et al., “Discovering molecular pathways from protein interaction and gene expression data”, Bioinformatics, 2003, Vol. 19, pp. 264- 272.

Shen J., Zhang J., Luo X. et al., “Predicting protein–protein interactions based only on sequences information”, Proceedings of the National Academy of Sciences USA (PNAS), 2007, Vol. 104(11), pp. 4337-4341.

Singhal M., Resat H. et al., “A domain-based approach to predict protein-protein interactions”, BMC Bioinformatics, 2007, Vol. 8, pp. 199-217.

Sprinzak E., Altuvia Y. and Margalit H., “Characterization and prediction of protein–protein interactions within and between complexes”, Proceedings of the National Academy of Sciences USA (PNAS), 2006, Vol. 103(40), pp. 14718-14723.

Stelzl U., Worm U., Lalowski M. et al., “A Human Protein-Protein Interaction Network: A Resource for Annotating the Proteome”, Cell, 2005, Vol. 122, pp. 957–968.

Uetz P., Giot L., Cagney G. et al., “A comprehensive analysis of protein–protein interactions in Saccharomyces cerevisiae”, Nature, 2000, Vol. 403, pp. 623-627.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top