[发明专利]一种基于深度学习的蛋白质结构预测方法有效

专利信息
申请号: 201610735964.X 申请日: 2016-08-26
公开(公告)号: CN106372456B 公开(公告)日: 2019-01-22
发明(设计)人: 张贵军;俞旭锋;周晓根;郝小虎;王柳静 申请(专利权)人: 浙江工业大学
主分类号: G16B15/20 分类号: G16B15/20;G06N3/04
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于深度学习Residue2vec的蛋白质结构预测方法,给定输入序列信息,将PDB网站上已知的蛋白质结构看成语料库进行训练,将结构已知的蛋白质分割成长度为n的残基,通过CBOW模型结合Huffman编码,获取每个残基在向量空间中的表示,通过计算残基向量之间的距离来判断残基间的相似性,从而获取查询序列每个残基位置上的前N个片段结构,构成了Residue2vec的片段库;然后对查询序列进行随机折叠构成初始构象;之后随机选取其中一个长度为n的残基,与片段库中的片段进行二面角的替换;进而比较能量,若能量减小则接收构象,若能量增大则以Metropolis准则接收构象,通过不断迭代最终获得亚稳态构象。本发明查询序列中匹配度较高、预测精度较高。
搜索关键词: 一种 基于 深度 学习 residue2vec 蛋白质 结构 预测 方法
【主权项】:
1.一种基于深度学习的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定输入序列信息;2)构建模板库中的残基向量:2.1)从蛋白质数据库网站上下载分辨率小于的高精度蛋白质,其中为距离单位,米;去除相似度大于预设阈值的冗余多肽链,得到非冗余蛋白质模板库;2.2)通过滑动窗口将非冗余蛋白质模板分割为长度为n的残基;2.3)通过CBOW模型结合Huffman编码,在神经网络中对残基模型进行建模,同时也获得残基在向量空间中的表示;2.4)针对查询序列中每个位置上的残基,通过残基向量计算距离来判断残基间的相似性;2.5)选取与查询序列每个残基位置上距离最近的前N个残基,构建了查询序列的片段库;3)初始化:最大迭代次数iteration,能量函数选用Rosetta Score3,温度为T,玻尔兹曼常数为k;4)开始迭代,设置i=1:4.1)通过Rosetta Score3能量函数计算构象能量为E1,随机选取构象中某一位置上长度为n的残基,随机从片段库中选一个残基片段将其替换;4.2)计算片段替换后的残基能量E2,比较E1和E2,若E2E1,则根据概率:P=e‑△E/(kT)接收构象,其中e为自然常数,△E=E2‑E1;4.3)若构象在连续的预设次数迭代中均未改变时,则提高温度T来改变接收概率,当构象再次被接收时,温度恢复至初始值;5)i=i+1,并判断i是否大于设定的最大迭代次数iteration,如果不满足则转至4.1);如果满足,则输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610735964.X/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top