[发明专利]蛋白质复合物深度多序列比对方法有效
申请号: | 201911290749.3 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111145833B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 於东军;刘子;朱一亨 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/00;G16B40/00;G16B50/00 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 复合物 深度 序列 方法 | ||
本发明公开了一种蛋白质复合物深度多序列比对方法,包括:步骤1、蛋白质单体多序列比对搜索,然后基于基因组距离将两个蛋白质单体多序列比对结果进行结合;步骤2、蛋白质单体多序列比对搜索,然后基于物种匹配将蛋白质单体多序列比对结果进行结合;步骤3、蛋白质单体多序列比对搜索,然后基于蛋白质相互作用网络关系将蛋白质单体多序列比对结果进行结合。该方法用于解决预测蛋白质复合物之间的接触图谱问题中由于不能直接从蛋白质复合物序列信息直接构建蛋白质复合物多序列比对而导致不能大规模预测分析蛋白质复合物的接触图谱的问题,该方法具有预测精度高、泛化能力强的优点。
技术领域
本发明涉及生物信息学中蛋白质复合物深度多序列比对领域,具体地说是一种认知蛋白质单体序列与其构成复合物序列蛋白质之间蛋白质家族相似性关系的方法。
背景技术
生物信息学是一门生物学与信息科学交叉而形成的年轻学科,它是当今生命科学和自然科学的重大前沿领域之一,其研究重点主要体现在基因组学和蛋白质组学两方面。生物信息学的研究对于加深对人类生命过程的认知,帮助人们改善其生存环境和提高生活质量有着重要意义,得到了国内外学者广泛重视。
蛋白质作为生命现象的物质基础之一,是构成一切细胞组织结构的重要组成成分,参与了生物体内许多方面的重要生命过程,是生命活动的重要承担者。虽然说脱氧核糖核酸 (DNA)是遗传信息的载体,但是遗传信息的复制、转录和表达都需要依靠各种蛋白质之间的协作才能完成。蛋白质组学较之于基因组学,对于生命现象的解释更直接、更准确,近年得到了快速发展,并受到世界各国学者的高度关注。在后基因组时代,随着蛋白质测序技术的飞速发展,蛋白质序列的数据呈爆炸性增长,目前在著名的蛋白质数据库UniProtKB中,已经存有超过120,243,849条蛋白质的一级序列信息(截止到2018-07-16),并继续保持快速增长的趋势。然而,面对如此海量的蛋白质序列信息,以当前已测序的蛋白质数据为例,0.1%(140,000)的蛋白质被求解出三维结构,0.3%的真实蛋白质复合物被实验验证并解出三维结构,收录在著名的蛋白质结构数据库PDB中。这个差距更会随着技术的不断进步和成熟而不断扩大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911290749.3/2.html,转载请声明来源钻瓜专利网。