[发明专利]基于结构网络模型的蛋白质功能位点预测方法有效
申请号: | 201810643576.8 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108830043B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 严文颖;沈百荣;杨洋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 杨慧林 |
地址: | 215131 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 网络 模型 蛋白质 功能 预测 方法 | ||
本发明涉及一种基于结构网络模型的蛋白质功能位点预测方法,包括:预测蛋白质结合位点;输入关于演化、物理化学性质、结构以及动态性这四个方面衡量蛋白质中每个残基的性质;基于蛋白质的三维结构对每个蛋白质构建其点加权的蛋白质结构网络(Node‑weighted Protein Structure Network,NPSN);定义并计算点加权的蛋白质结构网络的参数;基于以上网络参数,利用随机森林模型预测蛋白质中的别构残基的概率。整合残基物理化学性质、序列信息、蛋白质结构特征、动态特征,节省时间,适用于大规模的、批量蛋白质功能位点预测,并提高预测的准确性。
技术领域
本发明涉及蛋白质,特别是涉及基于结构网络模型的蛋白质功能位点预测方法。
背景技术
蛋白质是生命活动的物质基础,几乎与所有的生命活动紧密联系在一起。在各种生命过程中蛋白质发挥着多种多样的功能,如信号传导、存储和运输、机械支撑、跨膜运输、神经信号的产生和传递等。蛋白质一般是通过和其它分子,如DNA、RNA、配体或其它蛋白质等的相互作用来实现自己的功能,但并不是蛋白质中所有的残基都直接参与了蛋白质功能的执行。直接参与了蛋白质功能的残基被称为功能性残基,它们对蛋白质的功能通常起了关键的作用。
别构残基是指蛋白质中上与正构位点在位置上有一定距离的结合位点,在别构调控中起着重要的作用。别构调控是生物体系中广泛存在的功能调节方式。蛋白质别构残基的预测是掌握蛋白质功能和生物过程的基础,同时也是生物医学数据分析技术领域的热点。
目前现有的蛋白质别构位点的计算预测方法主要可以分为两类:基于序列的方法和基于结构的方法。其中,基于蛋白质结构网络的方法也是基于蛋白质三维结构的。
传统技术存在以下技术问题:
1)基于序列的方法往往对序列保守性要求较高,对于序列相似度较低的情况下则计算结果并不准确;
2)基于结构的方法如基于分子模拟的方法,计算复杂度较高,耗时较长,较难进行批量的蛋白质功能位点的预测;而基于模板的方法对于没有相似结构的蛋白质预测结果差;
3)基于蛋白质结构网络的方法忽略了残基本身的性质,忽略了残基的异质性并且视为均一的、无差别的节点;
4)泛化性差,目前方法往往是针对一种类型的蛋白质功能残基的预测,可扩展性差。
发明内容
基于此,有必要针对上述技术问题,提供一种基于结构网络模型的蛋白质功能位点预测方法,整合残基物理化学性质、序列信息、蛋白质结构特征、动态特征,节省时间,适用于大规模的、批量蛋白质功能位点预测,并提高预测的准确性。
一种基于结构网络模型的蛋白质功能位点预测方法,包括:
预测蛋白质结合位点;
输入关于演化、物理化学性质、结构以及动态性这四个方面衡量蛋白质中每个残基的性质;
基于蛋白质的三维结构对每个蛋白质构建其点加权的蛋白质结构网络(Node-weightedProtein Structure Network,NPSN);
定义并计算点加权的蛋白质结构网络的参数;
基于以上网络参数,利用随机森林模型预测蛋白质中的别构残基的概率。
在另外的一个实施例中,步骤“预测蛋白质结合位点;”中,利用CAVITY软件预测蛋白质结合位点。
在另外的一个实施例中,步骤“输入关于演化、物理化学性质、结构以及动态性这四个方面衡量蛋白质中每个残基的性质;”中,具体的参数包括:保守分数、质量、疏水性、极性、相对溶剂可及表面积和柔性;其中,以上所有残基的性质都进行蛋白质内归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810643576.8/2.html,转载请声明来源钻瓜专利网。