[发明专利]一种基于多模态构象空间采样的蛋白质结构预测方法有效

申请号：	201910793325.2	申请日：	2019-08-27
公开（公告）号：	CN110718267B	公开（公告）日：	2021-04-06
发明（设计）人：	张贵军;赵凯龙;刘俊;彭春祥;周晓根	申请（专利权）人：	浙江工业大学
主分类号：	G16B15/20	分类号：	G16B15/20
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	王利强
地址：	310014 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于多模态构象空间采样蛋白质结构预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多模态构象空间采样的蛋白质结构预测方法，其特征在于，所述方法包括以下步骤：

1)输入预测蛋白质的序列信息，读取序列长度L；设置参数：种群规模N，迭代次数G，阈值ε；

2)根据目标蛋白序列信息，利用Robetta构建片段库；

3)迭代Rosetta第一、二阶段，生成具有N个个体的初始种群

4)按照如下方式计算两个个体之间的相似度：

4.1)对于每一个个体，计算每一对氨基酸之间的距离，当两个氨基酸之间的距离小于等于时，则定义为接触，记为1，否则记为0，最终构建出一个L×L的接触矩阵，记两个个体的接触矩阵分别为M¹、M²；

4.2)按照如下公式给形成的接触分配权重：

其中i和j均∈{1,2，…L}，表示氨基酸序号，|i-j|表示两个氨基酸在序列上的距离；

4.3)将两个个体的接触矩阵重叠，按如下公式计算两个接触矩阵形成交集的点的分数总和，记为S_overlap：

按如下公式计算两个接触矩阵形成并集的点的分数总和，记为S_total：

将两个体的相似度分数为：

5)根据步骤4)计算种群中所有个体两两之间的相似度；

6)运用N-1阶近邻方法确定模态数目：

6.1)把两个个体之间的相似度分数作为两个个体之间的距离V，令V₁ⁱ为个体P_i^init的一阶最短近邻距离，为个体P_i^init的二阶最短近邻距离，以此类推则有：

6.2)按如下公式分别计算j阶最短近邻距离的平方均值和平均值

6.3)计算N-1阶方差：

6.4)根据计算出的N-1个方差值按如下公式统计方差的阶跃点数目，当公式成立时，阶跃点数目加一：

6.5)统计得出阶跃点数目为U，则模态数目为K＝U+1；

7)运用K-均值聚类算法对种群进行聚类，形成K个模态；根据这K个模态将种群划分成K个子种群，记作

8)设g＝1，g∈{1,2,...,G}；

9)对每个模态中的每个个体依次进行交叉、变异和排挤操作，过程如下：

9.1)交叉操作：从目标个体P_i^k所在的模态中随机选择两个互不相同且与P_i^k不同的个体，记作在[1,L-2]内生成两个不同的随机整数rand1和rand2；将P_i^k的第rand1至rand1+2号残基的二面角值替换成对应残基的二面角值，将P_i^k的第rand2至rand2+2号残基的二面角值替换成对应残基的二面角值，形成交叉后的个体P_i^k′；

9.2)变异操作：在[1,L-2]内生成与rand1和rand2不同的随机整数rand3；在rand3对应的滑动窗口的片段库中随机选一个片段，替换P_i^k′的第rand3至rand3+2号残基，形成变异后的个体P_i^k″；

9.3)排挤操作：用Rosetta score3能量函数计算个体P_i^k″的能量值，按照步骤4)的方法计算个体P_i^k″与该模态中所有个体的相似度，找到与个体P_i^k″最相似的个体，若该个体能量值比P_i^k″高，则替换掉该个体；

10)g＝g+1；若g≤G，转至步骤9)；

11)选出每个模态中能量最低的个体作为最终输出结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910793325.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多模态构象空间采样的蛋白质结构预测方法有效

专利文献下载