[发明专利]一种基于残基接触信息自学习的蛋白质结构预测方法有效

专利信息
申请号: 201810986060.3 申请日: 2018-08-28
公开(公告)号: CN109215732B 公开(公告)日: 2021-04-06
发明(设计)人: 张贵军;谢腾宇;马来发;周晓根;王柳静;郝小虎 申请(专利权)人: 浙江工业大学
主分类号: G16B15/20 分类号: G16B15/20
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于残基接触信息自学习的蛋白质结构预测方法,首先,利用Robetta和RaptorX‑Contact得到片段库和接触图;其次,在种群进化第一阶段进行残基对距离分布的学习并建立信息熵指标反映种群的收敛程度,达到自主学习的目的;然后,在最后种群进化第二阶段,利用学习到的残基对距离分布信息建立评分函数,辅助能量函数进行构象空间搜索;最后,通过聚类得到最终预测结果。本发明提供一种蛋白质结构预测方法,一方面可以自主学习残基对距离信息,辅助能量函数进行构象空间优化;另一方面,构建信息熵指标,实现两阶段的动态切换。
搜索关键词: 一种 基于 残基 接触 信息 自学习 蛋白质 结构 预测 方法
【主权项】:
1.一种基于残基接触信息自学习的蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;2)利用RaptorX‑Contact预测该序列的接触图,获得N个残基对的接触情况,并将接触图中的第k个残基对间的接触,接触是指Cα‑Cα欧氏距离小于接触概率表示为Pk,k∈{1,...,N};3)初始化:种群规模NP,信息熵阈值α,种群第一阶段和第二阶段最大迭代次数分别为G1,G2,根据输入序列,执行Rosetta Abinitio协议的第一与第二阶段NP次,产生初始构象种群P={C1,C2,...,CNP},其中CNP表示第NP个个体,记当前代数g=0;4)进入种群进化第一阶段,过程如下:4.1)利用能量函数Rosetta score3对种群所有个体进行评分,并由高到低排序;4.2)对前50%的个体分别进行片段组装,片段长度为9,并且根据Metropolis准则概率接收,g=g+1;5)计算当前种群的熵值,过程如下:5.1)残基对间距离离散化:根据第k个残基对的Cα‑Cα欧氏距离dk,满足为间隔将dk离散化为13个区域,每个区域对应相应的距离范围,具体规则如下:表示向下取整,B表示区域索引号,B∈{1,...,13};5.2)计算种群在第k个残基对落入第B块区域的比例qk,B;5.3)学习当前种群的残基对的距离分布:当g=0,令其中w是学习保守因子,0≤w≤1;5.4)根据当前种群的分布情况建立信息熵指标6)判断种群是否满足切换条件E<α或者g>G1,若满足,结束种群进化第一阶段,执行下一步;否则返回步骤4);7)记第一阶段最终学习得到的残基对距离分布为Lk,B,并记g=0;8)进入种群进化第二阶段,过程如下:8.1)以个体Ci,i∈{1,...,NP}为目标个体,对其进行片段组装,片段长度为3,得到测试个体Ci′;8.2)利用Rosetta score3评价Ci和Ci′,得到各自的能量值为E和E′;8.3)利用残基对距离分布Lk,B建立残基对距离评分函数,分别计算Ci和Ci′的k个残基对距离落入的区域,记为b1,b2,...,bm...,bk和b1′,b2′,...,bn′...,bk′,bm∈{1,2...,13},bn′∈{1,2...,13},m∈{1,2...,k},n∈{1,2...,k},该评分函数可以表示为:8.4)若满足E>E′,S>S′,则接受Ci′,令Ci=Ci′;8.5)否则随机选择能量函数或者残基对距离评分函数,并根据Metropolis标准选择;8.6)遍历当前种群所有个体,得到下一代种群,令g=g+1;8.7)判断是否满足终止条件g>G2,若满足,结束种群进化第二阶段,执行下一步;否则返回8.1);9)利用SPICKER对第二阶段接受的构象进行聚类,将最大类的类心构象看作最终预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810986060.3/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top