研究生(外文):Ming-tsun Chiang
論文名稱(外文):Evidence Providing System for Protein-Protein Interactions by Automatic Constructed Templates
指導教授(外文):Jung-hsien Chiang
  The main source of protein-protein interactions is PubMed articles. By studying interactions from previous research, scholars all around the world can understand the states of current progress, and they can take advantage of these to expand pathway and protein functions. However the survey of documents is time-consuming and exhaustive. It is more efficient to use information extraction technology to filter superfluous information. To develop a robust and reliable system to mine protein-protein interactions, we need patterns for the recognition of natural language. In this paper, we propose a evidence providing system forprotein-protein interactions based on patterns and integrate decision model to extract PPI sentences from scientific literature.
  Unlike other system depend on manual rules, we present a machine learning approach to construct patterns automatically and several attributes to assist to cooperate with pattern model. We also demonstrate that our system is able to provide protein interaction sentences well.
第一章 導論 1
1.1 前言 1
1.2 研究動機 2
1.3 解決方法 2
1.4 論文架構 3
第二章 相關研究 4
2.1 生物資訊學 4
2.1.1 PubMed 5
2.1.2 基因名稱資料庫 6
2.1.3 BioCreative 7
2.2 文件分析與相關技術 9
2.2.1 自然語言處理技術 9
2.2.2 機器學習與樣板建立 10
2.3 蛋白質交互作用系統 11
2.3.1 iHOP 12
2.3.2 PreBind 13
第三章 使用自動化樣板建立的蛋白質與蛋白質交互作用驗證提供系統 15
3.1 系統概論 15
3.1.1 系統架構圖 16
3.1.2 系統概念圖 17
3.2 樣板建立 18
3.2.1 雙蛋白質句選取 18
3.2.2 自動化樣板建立 19
3.3 PubMed文件分析 22
3.3.1 文件擷取 22
3.3.2 蛋白質作用辨識 24
3.4 資訊整合 26
3.4.1 屬性權重計算 26
3.4.2 句子過濾與結果產生 29
第四章 實驗設計與結果分析 31
4.1 資料集介紹與處理 31
4.1.1 LLL資料庫 31
4.1.2 MINT資料庫 33
4.2 實驗設計 35
4.2.1 實驗一 35
4.2.2 實驗二 36
4.2.3 實驗三 36
4.2.4 實驗四 36
4.3 實驗結果分析 36
4.3.1 實驗一結果分析 37
4.3.2 實驗二結果分析 41
4.3.3 實驗三結果分析 42
4.3.4 實驗四結果分析 44
4.4 系統介紹 45
第五章 結論與未來展望 48
5.1 結論 48
5.2 未來展望 49
參考文獻 50
附錄一 關鍵詞表 52
