[发明专利]一种基于拉氏图的群体蛋白质结构预测方法有效
申请号: | 201810238720.X | 申请日: | 2018-03-22 |
公开(公告)号: | CN108629151B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 李章维;余宝昆;孙科;肖璐倩;王柳静;郝小虎;周晓根;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拉氏图 群体 蛋白质 结构 预测 方法 | ||
一种基于拉式图的群体蛋白质结构预测方法,首先,根据群体的初始化得到全局搜索后的构象;然后,把初始化后的群体进行交叉变异得到新的群体,增加了群体的多样性信息;其次,合并初始群体和交叉变异后的群体,使用能量函数计算种群个体的能量,挑选优秀的个体组成新的群体;最后,通过从拉氏图中采样更新个体的Loop区域,使用能量函数判断是否接收,输出最终的构象。本发明提供一种预测精度较高的基于拉式图的群体蛋白质结构预测方法。
技术领域
本发明涉及一种生物信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于拉氏图的群体蛋白质结构预测方法。
背景技术
蛋白质是生命的物质基础,是生命活动的主要承担者。组成蛋白质的基本单元是氨基酸,氨基酸经脱水缩合形成肽链,肽链再通过折叠形成了具有特定功能的三维结构。蛋白质的三维结构决定了蛋白质特定的功能,了解蛋白质的结构和功能之间的关系可以帮助我们设计具有特定功能的新型蛋白质、设计药物和疫苗、了解蛋白质折叠类疾病的病理等等。目前,蛋白质的实验测定方法主要有X-射线衍射法和核磁共振法(NMR),但是两种方法所需的时间长且耗资巨大,不适合大规模的蛋白质结构预测,使用计算机模拟的蛋白质结构预测是现在最有前景的蛋白质结构预测方法。
蛋白质结构预测方法主要有同源建模法和从头预测法,同源建模法的思想是序列相似的蛋白质结构也是相似的,因此当目标蛋白与模板蛋白的具有较高的序列相似度时(30%),使用此方法得到的精度较高。从头建模法也叫无模板建模方法,不依赖序列和结构的关系,应用最广的是片段组装方法。片段组装仅使用蛋白质骨架原子的扭转角来简化的表示蛋白质的三维结构,首先将整条序列分割成多个9-mer或者3-mer片段,片段之间允许相互重叠,对每个片段,从PSI-BLAST计算出的相似序列对应的结构中,截取出相应位置的局部结构作为候选结构,然后使用MonteCarlo算法从每个片段的候选结构集中挑选出一个进行组合,使得组合成的全长结构能量最小。
拉氏图是Ramachandran等人于1963年至1968年根据肽单位刚性球面模型计算出来的,以ψ和φ表示的角度为横纵坐标,规定ψ、φ角允许的构象区域的一个图形。拉氏图表示的是α碳的二面角,ψ表示一个肽单位中α碳左边C-N键的旋转角度,φ表示α碳右边C-C键的旋转角度,理论上这C-N键和C-C键都可以自由的转动,由于键的转动会带动其他原子一起转动,所以在实际中由于分子各个基团的空间障碍和作用力的影响,拉氏图就有了允许出现的区域和不允许出现的区域。
在蛋白质结构从头预测方法中,由于能量函数的不精确以及采样能力的不足会导致构象空间的搜索效率低、收敛速度慢、局部搜索能力弱的问题,从而影响预测精度。因此,如何提高算法的搜索效率,加强局部搜索的能力是我们需要解决的问题。
发明内容:
为了解决能量函数的不精确和构象空间搜索不充足导致的蛋白质结构预测精度低的问题,本发明提出了一种基于拉氏图的群体蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于拉氏图的蛋白质结构预测方法,所述方法包括以下步骤:
1)参数设置,过程如下:
设置蛋白质群体的构象为P={x1,x2,...,xi,...xN},i∈[1,N],其中xi表示群体的
第i个个体,预测蛋白的序列长度为l,群体规模为N,交叉概率CR,变异
概率f∈{3,9}为片段插入长度,交叉变异代数G,拉氏图采样代数t,最
大迭代代数Gmax,设置能量函数;
2)构建目标蛋白的拉氏图,过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810238720.X/2.html,转载请声明来源钻瓜专利网。