[发明专利]一种利用粒子群模拟退火算法来进行蛋白质折叠预测的方法在审
申请号: | 201710953804.7 | 申请日: | 2017-10-13 |
公开(公告)号: | CN107704726A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 王凤娟;姜淑凤;甄英琦;李明;张宏斌;樊锐;王兴国;刘秀林 | 申请(专利权)人: | 齐齐哈尔大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 哈尔滨龙科专利代理有限公司23206 | 代理人: | 高媛 |
地址: | 161006 黑*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种利用粒子群模拟退火算法来进行蛋白质折叠预测的方法,属于蛋白质结构预测技术领域。所述方法如下利用粒子群算法和模拟退火算法优缺点互补的原理,将两种算法进行融合得出新的粒子群模拟退火算法;将步骤一得到的粒子群模拟退火算法应用在蛋白质折叠预测的能量函数上,求能量函数的全局最小值即为蛋白质折叠最好的状态;将粒子群模拟退火算法应用在斐波那契序列上进行预测,来验证粒子群模拟退火算法的有效性。本发明的优点是一种在蛋白质折叠预测方面有较好效果的粒子群模拟退火算法,该算法能够在运算精度高、搜索时间短的情况下搜索到蛋白质序列的最低能量构形,从而能够有效的预测蛋白质的结构。 | ||
搜索关键词: | 一种 利用 粒子 模拟 退火 算法 进行 蛋白质 折叠 预测 方法 | ||
【主权项】:
一种利用粒子群模拟退火算法来进行蛋白质折叠预算的方法,其特征在于:所述方法具体步骤如下:步骤一:利用粒子群算法和模拟退火算法优缺点互补的原理,将两种算法进行融合得出新的粒子群模拟退火算法;步骤二:将步骤一得到的粒子群模拟退火算法应用在蛋白质折叠预测的能量函数上,求能量函数的全局最小值即为蛋白质折叠最好的状态;所述的能量函数如下:U=2ω1Σi<jUsci,scj+ω2Σi≠jUsci,pj+c---(1)]]>式(1)中,为疏水键能,即联合侧链sci和scj相互之间的作用能,εij表示的是能量参数,xij(i=1,2,...,n)表示的是联合侧链之间位置关系,其中n为结构X中元素的个数,若两个侧链在某格点上相邻而在其序列不相邻时xijn=1,否则xij=0;若sci与scj有疏水性时,εij=‑2.3kJ/mol;若sci与scj有亲水性时,εij=0kJ/mol;若一个有亲水性,一个有疏水性时,εij=‑1kJ/mol;表示惩罚项,是为了避免一个残基侧链和另一残基主链离得太近造成不合理的构形而加入的;如果sci与scj相邻,则rij忽略不计;如果不相邻,则rij≈‑0.05kJ/mol,xij=0;因此乘积rij xij始终为0,故第二项为权重,C为常数;蛋白质的结构预测归结为求如下的优化问题:minf(X)s.t.X∈Ω---(2)]]>式(2)中,f(X)表示势能函数,Ω表示构象空间,一般采用的是区域分裂的技术来优化求解问题;由于Xk为蛋白质的某种结构,如果结构中的每一元素的亲、疏水性已确定,那么要得到能量最小的结构只需知道元素之间的位置关系;由式(1)知该结构的总能量为Uk=Σi=1nΣj=1nUsci,scjk+c=Σi=1nΣj=1nϵijxijk+c,(i≠j)---(3)]]>令U=(U1,U2,...Um)则其中,m为总构象数,U为能量分布矩阵,优化问题归结为求Xk(1≤k≤m),使得Uk=min{U1,U2,...,Um};步骤三:将粒子群模拟退火算法应用在斐波那契序列上进行预测,来验证粒子群模拟退火算法的有效性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐齐哈尔大学,未经齐齐哈尔大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710953804.7/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用