[发明专利]一种基于多目标遗传算法的带假结核酸结构预测方法有效
申请号: | 201811325483.7 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109599146B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张凯;许志伟;吕育林;胡威;符海东;张晓龙;贺娟娟;刘俊;刘小明;廖雪超 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 王健 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多目标 遗传 算法 结核 结构 预测 方法 | ||
1.一种基于多目标遗传算法的带假结核酸结构预测方法,包括以下步骤:
S100,设置最小茎区数MinStem、环中最小碱基数MinLoop、最大假结数MaxPesudoKnot,种群规模N,变异率Pc,交叉率Pm,最大进化代数Gen进行初始化;
S101,长度为n的RNA序列S表示为x1x2x3…xn,其中xi∈{A,C,G,U},1≤i≤n;对RNA序列的每个碱基,用碱基所在位置序号来代替,表示为1,2,3,…,i,…,n的编码方式称为长度编码;
S102,判断待检测RNA序列中的碱基配对情况,当RNA序列中i,j位置发生碱基配对时,将对应位置的碱基编码进行交换;根据碱基配对情况计算符合碱基配对规则的随机点匹配列表:
(i,j,k),
其中i,j分别表示RNA分子序列的第i个位置和第j个位置可以进行匹配,k为随机碱基对(i,j)的连续匹配数,得到随机点(i,j)的k连续匹配集(i,j,k1,k2,k3,…,kn)用以表示位置i和位置j匹配时可选的连续匹配数集合;随机点匹配列表(i,j,k)中随机数i,j同时满足以下关系:
ij
j-i-k3
最小茎区数≤k≤2/3*序列长度n
若随机数不满足上述关系,则重新生成随机数;若满足,则判断是否满足k连续匹配;若不满足k连续匹配,则重新生成随机点,满足,则添加到随机点匹配列表中;生成随机点匹配列表(i,j,k)后对其进行k连续匹配验证,步骤如下:
首先对单独位置上的碱基组合依照Watson-Crick碱基配对规则进行校验,先把分子序列重新编码,编码规则按照A,C,G,U依次对应0,1,2,3,根据碱基配对规则,若第i位置与第j位置为基本匹配,即A-U,G-C或U-A,C-G配对时,需要满足如下条件:
RnaSeq[i]+RnaSeq[j]=3
当匹配为G-U或U-G配对时,则需满足以下条件:
RnaSeq[i]+RnaSeq[j]=5
当从第i位置开始到第i+k-1位置为止分别与第j位置开始到第j-k+1位置为止,均满足上述条件,则随机生成的三元组(i,j,k)满足k连续匹配;
S103,使用模拟退火算法从连续匹配数集合中随机产生N个随机RNA序列,设为初始种群P0;
S104,对当前种群Pt进行遗传操作,包括对种群中N个RNA序列进行选择、交叉和变异,得到子种群Qt;
S105,将父代种群Pt和子种群Qt合并成为整体种群Rt;
S106,对整体种群Rt根据评价函数进行非支配排序构造出不同等级的非支配解集Z1,Z2,Z3…,对分配好等级的非支配解集进行拥挤距离排序;
其中评价函数定义如下:F=(总的碱基匹配数,总分组数)
S107,根据排序的高低挑选出前N个解,构成下一次迭代的父代种群Pt+1;
S108,判断进化代数是否达到设定的最大值Gen,如果达到最大值则进入步骤S109,否则进入步骤S104;
S109,输出Pareto最优解集
S110,计算Pareto最优解集中所有RNA分子的自由能,输出自由能最小的RNA分子结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811325483.7/1.html,转载请声明来源钻瓜专利网。