[发明专利]一种基于多目标遗传算法的带假结核酸结构预测方法有效

专利信息
申请号: 201811325483.7 申请日: 2018-11-08
公开(公告)号: CN109599146B 公开(公告)日: 2022-04-15
发明(设计)人: 张凯;许志伟;吕育林;胡威;符海东;张晓龙;贺娟娟;刘俊;刘小明;廖雪超 申请(专利权)人: 武汉科技大学
主分类号: G16B15/00 分类号: G16B15/00;G16B40/00
代理公司: 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人: 王健
地址: 430081 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于多目标遗传算法的带假结核酸结构预测方法,通过最小茎区数和环中最小碱基数来确定K连续匹配集,生成初始种群,然后使用多目标遗传算法对RNA分子序列进行选择、交叉和变异,并进行非支配排序和拥挤距离排序,得到Pareto分子结构最优解集,最后挑选出最优解集中自由能最小的RNA分子结构作为最终预测结果。该方法降低了时间复杂度和空间复杂度,并提高了带假结的RNA分子结构预测的准确率。
搜索关键词: 一种 基于 多目标 遗传 算法 结核 结构 预测 方法
【主权项】:
1.一种基于多目标遗传算法的带假结核酸结构预测方法,包括以下步骤:S100,设置最小茎区数MinStem、环中最小碱基数MinLoop、最大假结数MaxPesudoKnot,种群规模N,变异率Pc,交叉率Pm,最大进化代数Gen进行初始化;S101,长度为n的RNA序列S表示为x1x2x3...xn,其中xi∈{A,C,G,U},1≤i≤n;对RNA序列的每个碱基,用碱基所在位置序号来代替,表示为1,2,3,...,i,...,n的编码方式称为长度编码;S102,判断待检测RNA序列中的碱基配对情况,当RNA序列中i,j位置发生碱基配对时,将对应位置的碱基编码进行交换;根据碱基配对情况计算符合碱基配对规则的随机点匹配列表:(i,j,k),其中i,j分别表示RNA分子序列的第i个位置和第j个位置可以进行匹配,k为随机碱基对(i,j)的连续匹配数,得到随机点(i,j)的K连续匹配集(i,j,k1,k2,k3,…,kn)用以表示位置i和位置j匹配时可选的连续匹配数集合;S103,使用模拟退火算法从连续匹配数集合中随机产生N个随机RNA序列,设为初始种群P0;S104,对当前种群Pt进行遗传操作,包括对种群中N个RNA序列进行选择、交叉和变异,得到子种群Qt;S105,将父代种群Pt和子种群Qt合并成为整体种群Rt;S106,对整体种群Rt根据评价函数进行非支配排序构造出不同等级的非支配解集Z1,Z2,Z3…,对分配好等级的非支配解集进行拥挤距离排序;其中评价函数定义如下:F=(总的碱基匹配数,总分组数)S107,根据排序的高低挑选出前N个解,构成下一次迭代的父代种群Pt+1;S108,判断进化代数是否达到设定的最大值Gen,如果达到最大值则进入步骤S109,否则进入步骤S104;S109,输出Pareto最优解集S110,计算Pareto最优解集中所有RNA分子的自由能,输出自由能最小的RNA分子结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811325483.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top