[发明专利]一种基于深度学习的蛋白质结构预测方法有效
申请号: | 201610735964.X | 申请日: | 2016-08-26 |
公开(公告)号: | CN106372456B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 张贵军;俞旭锋;周晓根;郝小虎;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G06N3/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度学习Residue2vec的蛋白质结构预测方法,给定输入序列信息,将PDB网站上已知的蛋白质结构看成语料库进行训练,将结构已知的蛋白质分割成长度为n的残基,通过CBOW模型结合Huffman编码,获取每个残基在向量空间中的表示,通过计算残基向量之间的距离来判断残基间的相似性,从而获取查询序列每个残基位置上的前N个片段结构,构成了Residue2vec的片段库;然后对查询序列进行随机折叠构成初始构象;之后随机选取其中一个长度为n的残基,与片段库中的片段进行二面角的替换;进而比较能量,若能量减小则接收构象,若能量增大则以Metropolis准则接收构象,通过不断迭代最终获得亚稳态构象。本发明查询序列中匹配度较高、预测精度较高。 | ||
搜索关键词: | 一种 基于 深度 学习 residue2vec 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于深度学习的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定输入序列信息;2)构建模板库中的残基向量:2.1)从蛋白质数据库网站上下载分辨率小于
的高精度蛋白质,其中
为距离单位,
米;去除相似度大于预设阈值的冗余多肽链,得到非冗余蛋白质模板库;2.2)通过滑动窗口将非冗余蛋白质模板分割为长度为n的残基;2.3)通过CBOW模型结合Huffman编码,在神经网络中对残基模型进行建模,同时也获得残基在向量空间中的表示;2.4)针对查询序列中每个位置上的残基,通过残基向量计算距离来判断残基间的相似性;2.5)选取与查询序列每个残基位置上距离最近的前N个残基,构建了查询序列的片段库;3)初始化:最大迭代次数iteration,能量函数选用Rosetta Score3,温度为T,玻尔兹曼常数为k;4)开始迭代,设置i=1:4.1)通过Rosetta Score3能量函数计算构象能量为E1,随机选取构象中某一位置上长度为n的残基,随机从片段库中选一个残基片段将其替换;4.2)计算片段替换后的残基能量E2,比较E1和E2,若E2E1,则根据概率:P=e‑△E/(kT)接收构象,其中e为自然常数,△E=E2‑E1;4.3)若构象在连续的预设次数迭代中均未改变时,则提高温度T来改变接收概率,当构象再次被接收时,温度恢复至初始值;5)i=i+1,并判断i是否大于设定的最大迭代次数iteration,如果不满足则转至4.1);如果满足,则输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610735964.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种快速去除竖向支承的方法
- 下一篇:智能公交候车亭