跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.84) 您好!臺灣時間:2025/01/14 20:29
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:吳哲奇
研究生(外文):Che-Chi Wu
論文名稱:錯誤更正輸出碼在蛋白質序列之結構分類的研究
論文名稱(外文):A Study of Error-Correcting Output Codes for Structure Classification of Protein Sequence
指導教授:蔡志忠蔡志忠引用關係
指導教授(外文):Jyh-Jong Tasy
學位類別:碩士
校院名稱:國立中正大學
系所名稱:資訊工程所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2005
畢業學年度:93
語文別:英文
論文頁數:24
中文關鍵詞:蛋白質序列錯誤更正輸出碼結構分類
外文關鍵詞:Structure Classification of Protein SequenceError-Correcting Output Codes
相關次數:
  • 被引用被引用:0
  • 點閱點閱:232
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
蛋白質序列的結構分類與預測在生物資訊學領域上已經是一個很重要的研究題目。由於目前可以取得的蛋白質摺疊數量相當龐大,在機器學習上大部分的分類方法都會遭遇到眾所皆知的”誤測”問題。在這篇碩士論文之中,我們透過有關多類別的分類法來學習新的方法以減少已知問題所帶來的影響。我們首先使用支撐向量法(或支持向量機, SVM)作為基礎的分類器,並且使用錯誤更正輸出碼(ECOC)方法來達到高階的多重類別的分類。當多組的參數資料集合的分數一起組合使用時,多數投票決定的方法可以減少錯誤資料的干擾以及增加辨識的正確率。結果顯示我們的方法,在一個大部分的蛋白質測試資料集跟訓練資料集只有低於25% 序列相同的情況下,可以達到62.72%的預測正確率。
Structure classification and prediction of protein sequence has been
an important research theme in structural bioinformatics. Most
discriminative methods in machine learning suffers the well-known
"False Positives" problem due to the larger amount of folds
available. In this thesis, we study new approach with multi-class
classification methods to reduce the influence of the existing
problem. We use the support vector machine (SVM) method as base
classifiers and apply Error-Correcting Output Codes (ECOC) methods
to achieve high-level multi-class classification. When scores of
multiple parameter datasets are combined, majority voting reduces
noise and increases recognition accuracy. The results show that our
methods can obtain prediction accuracy 62.72% on a protein test
dataset, where most of the proteins have
below 25% sequence identity with the proteins used in training.
1 Introduction
2 Machine Learning Background
2.1 Support Vector Machines
2.2 Multi-class classi¯cation methods
2.2.1 One-against-others
2.2.2 One-against-one
2.3 Error-Correcting Output Codes(ECOC)
3 Preprocessing and Data Sets
3.1 Training Dataset
3.2 Independent Test Dataset
3.3 Feature Vector Extraction
4 Experiments and Results
4.1 One-against-one method
4.2 ECOC method
4.3 Combine one-against-one and ECOC
5 Conclusion
[1] Adam Berger. Error-correcting output coding for text classi¯cation. In
Proceedings of IJCAI-99 Workshop on Machine Learning for Information
Filtering, Stockholm, Sweeden, 1999
[2] Chris H.Q. Ding and Inna Dubchak. Multi-class Protein Fold Recognition
Using Support Vector Machines and Neural Networks., Bioinformatics,
v.17, no.4, pp.349-358, April 2001
[3] J. C. Platt. Sequential minimal optimization: A fast algorithm for train-
ing support vector machines., Technical Report MSR-TR-98-14, Microsfot
Research, 1998.
[4] J.H. Friedman. Another approach to polychotomous classi¯cation. Tech-
nical report, Stanford Department of Statistics, 1996. http://www-
stat.standford.edu/reports/friedman/poly.ps.Z.
[5] Rayid Ghani. Using error-correcting codes for text classi¯cation. In Pro-
ceedings of the Seventeenth International Conference on Machine Learn-
ing, 2000.
[6] S. Knerr, L. Personnaz, adn G. Dreyfus. Single-layer learning revis-
ited: A stepwise procedure for building and training a neural network..
In Forgelman-Soulie and Herault, editors, Neurocomputing: Algorithms,
Architectures and Applications, NATO ASI. Springer, 1990.
[7] T. G. Dietterich, G. Bakiri. Solving Multiclass Learning Problems via
Error-Correcting Output Codes. Journal of Arti¯cial Intelligence Research
2 pages 263-286, 1995.
[8] V. Vapnik. Statisical Learning Theory. Wiley, New York, NY, 1998.
[9] Yuh-Jye Lee, O. L. Mangasarian. SSVM: Smooth Support Vector Ma-
chine for Classi¯cation., Data Mining Institute Technical Report 99-03,
September 1999.
[10] Yuh-Jye Lee and O. L. Mangasarian. RSVM: Reduced Support Vec-
tor Machines., First SIAM International Conference on Data Mining,
Chicago, April 5-7, 2001
[11] The protein parameter datasets used in this thesis is available online
(http://www.nersc.gov/»cding/protein).
[12] The Libsvm software we used in this thesis is available at
(http://www.csie.ntu.edu.tw/»cjlin/libsvm).
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關論文
 
1. 林明禎(2000)。社區照顧福利輸送體系之初探-以老人日托暨嶺鼓A務為例,社區發展季刊,89,頁178-187。
2. 施教裕(1997)。福利社區化的理念與實務之探討。社區發展季刊,77,頁41-49。
3. 李宗派(2000)。系統理論在社會工作之應用。社區發展季刊,88,頁156-166。
4. 邱怡玟(2004)。家庭變遷下老年人之長期照顧何去何從。社區發展季刊,106,頁176-185。
5. 沙依仁(1996)。老人社區照顧之理論與實務。社區發展季刊,74,頁162-170。
6. 吳玉琴(2004)。台灣居家服務的現況與檢討。社區發展季刊,106,頁132-140。
7. 吳明儒(2003b)。從社會資本理論探討台灣福利社區化之困境-以美國CDC與LISC為借鏡。非營利組織管理學刊,2,頁39-70。
8. 洪毓甡(1997)。加入WTO對我國勞動者就業之影響。經濟情勢暨評論季刊,3(2)。http://www.moea.gov.tw/~ecobook/season/sa916.htm
9. 徐麗君(1995)。老人居家照顧的社會資源,社會建設,90,頁35-39。
10. 張英陣(2004)。社區照顧與非營利組織。社區發展季刊,106,頁60-67。
11. 陳世堅(1999)。個案管理導向之老人長期照護系統模式之探討。中華醫務社會工作學刊,7,頁17-33。
12. 黃源協(1998)。老人社區照顧的內涵與工作方法。社區發展季刊,83,頁157-167。
13. 黃源協、黃松林、蕭文高(1999a),社區照顧政策與實踐─以英國新堡市與台灣省台南市為例。暨大學報,3(1),頁263-296,國立暨南國際大學。
14. 黃源協(1999b)。福利社區化實驗計畫之評估分析─以彰化縣老人及身心障礙者方案為例,社會政策與社會工作學刊,3(1),頁9-65。中華民國社會政策學會。
15. 黃源協(2004)。從「全控機構」到「最佳價值」―英國社區照顧發展的脈絡與省思。社區發展季刊,106,頁308-330。