[发明专利]一种基于多目标遗传算法的带假结核酸结构预测方法有效
申请号: | 201811325483.7 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109599146B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张凯;许志伟;吕育林;胡威;符海东;张晓龙;贺娟娟;刘俊;刘小明;廖雪超 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 王健 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多目标遗传算法的带假结核酸结构预测方法,通过最小茎区数和环中最小碱基数来确定K连续匹配集,生成初始种群,然后使用多目标遗传算法对RNA分子序列进行选择、交叉和变异,并进行非支配排序和拥挤距离排序,得到Pareto分子结构最优解集,最后挑选出最优解集中自由能最小的RNA分子结构作为最终预测结果。该方法降低了时间复杂度和空间复杂度,并提高了带假结的RNA分子结构预测的准确率。 | ||
搜索关键词: | 一种 基于 多目标 遗传 算法 结核 结构 预测 方法 | ||
【主权项】:
1.一种基于多目标遗传算法的带假结核酸结构预测方法,包括以下步骤:S100,设置最小茎区数MinStem、环中最小碱基数MinLoop、最大假结数MaxPesudoKnot,种群规模N,变异率Pc,交叉率Pm,最大进化代数Gen进行初始化;S101,长度为n的RNA序列S表示为x1x2x3...xn,其中xi∈{A,C,G,U},1≤i≤n;对RNA序列的每个碱基,用碱基所在位置序号来代替,表示为1,2,3,...,i,...,n的编码方式称为长度编码;S102,判断待检测RNA序列中的碱基配对情况,当RNA序列中i,j位置发生碱基配对时,将对应位置的碱基编码进行交换;根据碱基配对情况计算符合碱基配对规则的随机点匹配列表:(i,j,k),其中i,j分别表示RNA分子序列的第i个位置和第j个位置可以进行匹配,k为随机碱基对(i,j)的连续匹配数,得到随机点(i,j)的K连续匹配集(i,j,k1,k2,k3,…,kn)用以表示位置i和位置j匹配时可选的连续匹配数集合;S103,使用模拟退火算法从连续匹配数集合中随机产生N个随机RNA序列,设为初始种群P0;S104,对当前种群Pt进行遗传操作,包括对种群中N个RNA序列进行选择、交叉和变异,得到子种群Qt;S105,将父代种群Pt和子种群Qt合并成为整体种群Rt;S106,对整体种群Rt根据评价函数进行非支配排序构造出不同等级的非支配解集Z1,Z2,Z3…,对分配好等级的非支配解集进行拥挤距离排序;其中评价函数定义如下:F=(总的碱基匹配数,总分组数)S107,根据排序的高低挑选出前N个解,构成下一次迭代的父代种群Pt+1;S108,判断进化代数是否达到设定的最大值Gen,如果达到最大值则进入步骤S109,否则进入步骤S104;S109,输出Pareto最优解集S110,计算Pareto最优解集中所有RNA分子的自由能,输出自由能最小的RNA分子结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811325483.7/,转载请声明来源钻瓜专利网。