[发明专利]基于回归森林模型的蛋白质序列二硫键连接模式的预测方法有效
申请号: | 201410303084.6 | 申请日: | 2014-06-27 |
公开(公告)号: | CN104063632B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 於东军;李阳;胡俊;沈红斌;杨静宇 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 南京理工大学专利中心32203 | 代理人: | 朱显国 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 回归 森林 模型 蛋白质 序列 二硫键 连接 模式 预测 方法 | ||
技术领域
本发明涉及生物信息学蛋白质序列中二硫键预测技术领域,具体而言涉及一种基于回归森林模型的蛋白质序列二硫键连接模式的预测方法。
背景技术
二硫键是最重要的蛋白质结构特性之一。二硫键是在蛋白质多肽链中两个半胱氨酸残基之间形成的主共价键,它们可以在肽链的链间或者链内形成。二硫键在蛋白质折叠方式以及稳定性方面有着非常重要的作用。因此,预测蛋白质里面的半胱氨酸残基组成二硫键的方式在预测蛋白质结构和功能上起着举足轻重的作用。
目前有很多种预测二硫键的方法,比如,DISULFIND法(A.Ceroni,A.Passerini,A.Vullo et al.,“DISULFIND:a disulfide bonding state and cysteine connectivity prediction server,”Nucleic Acids Research,vol.34,no.suppl2,pp.W177-W181,2006.)、Pair-Wise SVM法(C.-H.Tsai,B.-J.Chen,C.-h.Chan et al.,“Improving disulfide connectivity prediction with sequential distance between oxidized cysteines,”Bioinformatics,vol.21,no.24,pp.4416-4419,2005.)、SS_SVR法(J.Song,Z.Yuan,H.Tan et al.,“Predicting disulfide connectivity from protein sequence using multiple sequence feature vectors and secondary structure,”Bioinformatics,vol.23,no.23,pp.3147-3154,2007.)、FS_SVR法(L.Zhu,J.Yang,J.N.Song et al.,“Improving the accuracy of predicting disulfide connectivity by feature selection,”J Comput Chem,vol.31,no.7,pp.1478-85,May,2010.)、DBCP法(H.-H.Lin,and L.-Y.Tseng,“DBCP:a web server for disulfide bonding connectivity pattern prediction without the prior knowledge of the bonding state of cysteines,”Nucleic acids research,vol.38,no.suppl2,pp.W503-W507,2010.)、DISLOCATE法(DISLOCATE+MIp+iCOV)(C.Savojardo,P.Fariselli,M.Alhamdoosh et al.,“Improving the prediction of disulfide bonds in Eukaryotes with machine learning methods and protein subcellular localization,”Bioinformatics,vol.27,no.16,pp.2224-30,Aug15,2011.)、DMC法(C.Savojardo,P.Fariselli,P.L.Martelli et al.,“Prediction of disulfide connectivity in proteins with machine-learning methods and correlated mutations,”BMC Bioinformatics,vol.14,no.Suppl1,pp.S10,2013.)、DiANNA法(F.Ferrè,and P.Clote,“DiANNA1.1:an extension of the DiANNA web server for ternary cysteine classification,”Nucleic Acids Research,vol.34,no.suppl2,pp.W182-W185,2006.)等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410303084.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用