[发明专利]蛋白质折叠仿真中的模蛇方法有效
申请号: | 200810209785.8 | 申请日: | 2008-12-25 |
公开(公告)号: | CN101436230A | 公开(公告)日: | 2009-05-20 |
发明(设计)人: | 张菁;陈怀友;李艳波;李松;赵明;王立伟;王海玲;于思亮;温乃锋;刘波 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001黑龙江省哈尔滨市南岗区南通*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 折叠 仿真 中的 方法 | ||
(一)技术领域
本发明涉及的是一种蛋白质的计算机折叠方法。
(二)背景技术
蛋白质折叠的研究始于二十世纪六十年代初期,美国国家健康所的Anfinsen教授及其同事在研究中发现因加入变性剂而失去活性的核糖核酸酶,在除去变性剂后可以自发地折叠到天然构象从而重新具有生理活性,而且这一过程可以重复进行。
1968年,Levinthal在一篇论文中指出,蛋白质分子所能采取的可能的构象数目是一个天文数字,而它的天然构象只有一种,这让一些科学家相信,一定存在着一条特殊的折叠途径,蛋白质沿着这条途径进行折叠,经过一系列特定的中间体而快速折叠到天然构象。
从七十年代开始,几个研究小组相继在细胞色素,核糖核酸酶,鸡溶菌酶等蛋白质的重折叠实验中发现有中间体存在的迹象。
九十年代开始蛋白质折叠的理论研究开始多了起来,理论学家借助于简化的模型和计算机模拟,可以方便地模拟蛋白质折叠和去折叠。
很多研究蛋白质折叠模拟过程的方法都来源于模拟自然界生物系统的方法,例如:模拟完全依赖生物体自身的本能、通过无意识的寻优行为来优化其生存状态以适应环境的一类新型的仿生优化算法。仿生方法的蛋白质逆折叠算法是从已知的蛋白质空间结构出发,采用仿生方法和手段,来确定该空间结构的氨基酸序列的方法。
1、遗传算法
遗传算法(Genetic Algorithm,GA)是基于Darwin进化论和Mendel的遗传学说而发展起来的算法。由于采用了类似物种进化过程中基因的选择、交叉和变异等操作手段,使得遗传算法在本质上成为一类非确定性算法,具有全局搜索能力,特别适用于多峰值函数的最优解问题。
2、蚁群算法
蚁群算法吸收了蚂蚁群体行为的典型特征:一是能察觉小范围区域内状况,并判断出是否有食物或其他同类的信息素轨迹;二是能释放自己的信息素;三是所遗留的信息素数量会随时间而逐步减少。
3、粒子群优化算法
粒子群优化算法(Particle swarm optimization,PSO)源于对鸟群捕食行为的研究。PSO算法中,每个优化问题的潜在解都是搜索空间中的一只鸟,称之为“粒子”。所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定他们飞翔的方向和距离。然后粒子们就追随当前的最优粒子在解空间中搜索。
4、人工鱼群算法
人工鱼群算法(artificial fish-swarm algorithm,AFSA)是一种基于模拟鱼群行为的优化算法。在基本鱼群算法中,主要是利用了鱼的觅食、聚群和追尾行为,从构造单条鱼的底层行为做起,通过鱼群中各个体的局部寻优,达到全局最优值在群体中突现出来的目的。该算法具有良好的克服局部极值、取得全局极值的能力。并且算法中只使用目标函数的函数值,无需目标函数的梯度值等特殊信息,对搜索空间具有一定的自适应能为。算法对初值无要求,对各参数的选择也不很敏感。
5、其它算法
以上四种算法中,能量最小的是鱼群算法,折叠正确率最高的是粒子群算法,均方根差最好的是蚁群算法。总之,遗传算法各项指标均不如蚁群算法、粒子群算法和鱼群算法,这三种算法可以替代遗传算法。蚁群算法、粒子群算法和鱼群算法各有优缺点。中国专利申请号为200710072292.x,名称为“基于综合算法的蛋白质折叠过程的计算机模拟方法”的专利文件中,综合以上因素,主要结合遗传算法,模糊聚类算法和粒子群算法对蛋白质的三维结构进行预测,并对折叠过程进行模拟。该算法从计算机运算速度和存储容量出发,在保留折叠主要原因的情况下,忽略了折叠过程中的大量具体细节,从而大大提高了运算速度,成为适用于普通计算机的有效方法。但是由于忽略了折叠过程的大量具体细节,仿真的折叠过程与实际过程有较大偏差,许多蛋白质的折叠过程无法模拟。我们的发明针对综合算法的缺点,从理论和实现上提出了拟蛇方法仿真蛋白质折叠过程。
(三)发明内容
本发明的目的在于提供一种对于未知空间结构的蛋白质进行中间体和最终空间结构预测,从而减少蛋白质空间结构测定过程中所耗费的人力、物力,同时也可以提供折叠分析的蛋白质折叠仿真中的模蛇方法。
本发明的目的是这样实现的:
(1)选取一条直线蛋白质序列;
(2)做波浪运动,用函数sin(t)来表示;
(3)做短暂的直线运动,用函数x=x+t来表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810209785.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:万向可伸缩物料输送管
- 下一篇:一种纸机真空系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用