[发明专利]基于差分进化和构象空间退火的蛋白质三维结构预测方法有效
申请号: | 201310299435.6 | 申请日: | 2013-07-15 |
公开(公告)号: | CN103473482A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 张贵军;程正华;姚春龙;邓勇跃;周晓根;陈先跑 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 针对蛋白质三维结构预测这个高维复杂的优化问题,本发明提出了一种综合差分进化算法和构象空间退火算法的一种蛋白质三维结构预测方法,将差分进化算法融入到构象空间退火算法中,形成混合优化算法。在构象空间退火算法的框架下,差分进化算法能够很好的提高种群的多样性,同时差分进化算法中的全局优化因子能够增加种群竞争,提高了算法的收敛能力。仿真结果表明,该方法具有较好的收敛性能和预测精度,能够有效的找到脑啡肽的全局能量最小对应的结构。 | ||
搜索关键词: | 基于 进化 构象 空间 退火 蛋白质 三维 结构 预测 方法 | ||
【主权项】:
1.一种基于混合优化算法的蛋白质三维结构预测方法,其特征是:在构象空间退火算法的基础上,综合了差分进化算法,引入了几种不同的种子扰动策略,对蛋白质三维结构进行优化搜索,具体实现如下:1)、选择优化目标,确定蛋白质的力场模型函数E(X);2)、初始化进化种群:随机产生Nbank个蛋白质结构作为初始种群POP,同时设定算法各参数,并使用拟牛顿法对初始种群进行能量极小化处理;3)、将处理过的Nbank个蛋白质个体作为初始种群库firstbank,并设定初始Dcut=1/2Dave,其中D ave = 1 N bank * ( N bank - 1 ) Σ i = 1 N bank Σ j = 1 N bank Σ k = 1 N dire | θ k i - θ k j | , ]]> 其中i≠j,Ndre表示的是优化目标的维数,表示的是第i个蛋白质结构的第k个二面角;4)、将firstbank中的个体直接复制给Bank中,并更新Bank中的个体;5)、随机从Bank中选取M个个体作为种子,每个种子以不同的扰动策略产生10个新的个体,总共产生M*10个新个体;同时在循环过程中检查Bank中的个体是否全部都作为过种子,若库中的个体全部做过种子,而算法循环仍然未结束,则重新随机产生Nbank个蛋白质结构加入Bank中;6)、将新产生的个体经拟牛顿法进行能量极小化处理,然后将这些新产生的蛋白质结构更新给Bank各种子生境中,其中更新的具体操作:6.1)通过计算新产生个体B和Bank中的种子A之间的距离d(A,B),再将d(A,B)和Dcut进行比较,其中表示的是蛋白质结构A的第s个二面角,Ndre表示的是优化目标的维数;6.2)若d(A,B)<Dcut,则将新产生个体更新至此种子的生境中,同时若个体B所代表的能量值小于若小于A,则B成为这个种子生境的代表;6.3)若新产生个体B不属于Bank中任何的种子生境,则重新成为一个种子生境;同时为了保证Bank中生境总数不变,则移除Bank中能量值最大的种子生境;7)、检测此时种群中是否出现蛋白质全局能量最小结构;如若找到循环结束,没找到循环继续;每循环一轮,通过减小Dcut大小更新Bank,即每轮Dcut减小至Dave;8)、循环执行步骤4-7,直至达到终止条件或找到蛋白质全局能量最小结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310299435.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于网络架构的分析方法及其应用
- 下一篇:一种电能分项计量的方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用