[发明专利]基于多种群协助的量子遗传算法的RNA二级结构预测方法在审

专利信息
申请号: 201810220951.8 申请日: 2018-03-16
公开(公告)号: CN108629150A 公开(公告)日: 2018-10-09
发明(设计)人: 王云江;许青山;石莎;刘阳;王增斌 申请(专利权)人: 西安电子科技大学
主分类号: G06F19/18 分类号: G06F19/18;G06N3/12
代理公司: 西安长和专利代理有限公司 61227 代理人: 黄伟洪
地址: 710071 陕西省*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 量子遗传算法 最优个体 种群 旋转角 茎区 替换 预测 生物信息学技术 全局搜索能力 比特向量 进化代数 量子测量 搜索效率 停止条件 相容矩阵 遗传算法 初始化 染色体 迭代 更新 算法 量子 同源 并用 合作
【说明书】:

发明属于生物信息学技术领域,公开了一种基于多种群协助的量子遗传算法的RNA二级结构预测方法,根据RNA序列建立序列的茎区池和茎区相容矩阵;用量子比特向量来初始化多个染色体种群;对各种群量子测量;根据测量结果获取最优个体;取得全部种群中的最优个体b,并用它替换其他种群中最优个体和b非同源的最差个体,然后各种群用不同的旋转角更新,而其他不参与替换的种群用固定旋转角更新;迭代上述过程,直到满足停止条件。本发明有效的提升了量子遗传算法的全局搜索能力和搜索效率,降低了遗传算法的进化代数。同时各种群间抑制竞争相互合作有效的提升了算法的全局性,预测准确性大幅度增加。

技术领域

本发明属于生物信息学技术领域,尤其涉及一种基于多种群协助的量子遗传算法的RNA二级结构预测方法。

背景技术

目前,业内常用的现有技术是这样的:RNA二级结构是指RNA序列由自身回折形成的茎环结构,是一种介于一级结构和三级结构之间的结构,且存储较多高级结构信息,因此二级结构的研究是生物信息学领域的重要研究课题。二级结构的确定主要有两种方法:物理化学的实验方法和数学计算的预测方法。实验方法主要包括X射线晶体衍射和核磁共振(NMR)。虽然实验方法得到的结果精确,但由于RNA分子降解速度快,难以结晶,故通过等实验方法测定RNA分子的结构很不容易,费时费力,代价高昂,无法满足今天海量RNA二级结构预测的需求。另外实验方法只能测定包含较少碱基的RNA序列的二级结构,而面对分子量较大的RNA时,实验方法的精确度会急剧下降。为了解决上述实验方法的弊端,人们开始着手借助数学计算方法,并结合计算机从理论上去预测RNA的二级结构,然后做进一步的验证。目前RNA二级结构的预测主要有两种思路:基于系统发育的序列比对方法和基于分子热动力学最小自由能模型。基于最小自由能模型的主要算法有动态规划算法、茎区组合算法和启发类算法等。启发类算法属于随机类算法,无法保证每次计算都收敛到全局最优解,即自由能最小的结构。而如前所述,RNA的真实结构往往是一种次优结构,正好可以利用这个条件,使用启发类算法计算出指定阀值范围的所有二级结构,然后做进一步验证。常用的启发类算法有如遗传算法,模拟退火算法,神经网络算法等。现有的遗传算法有遗传算法(GA)、量子遗传算法(QGA)、增强型量子遗传算法(EQGA)。用遗传算法来预测RNA二级结构是一种比较基本的智能算法,用该算法来预测RNA二级结构是一种预测RNA二级结构的新思路,尽管算法能够预测RNA二级结构,但算法本身存在收敛速度慢、搜索效率低,易陷入局部极值点的问题。量子遗传算法,是一种将量子计算理论和遗传算法相结合的概率搜索算法,该算法具有更好的种群多样性和计算并行性的特点,这些特点使量子遗传算法具有更快的收敛速度和更高的搜索效率,但算法旋转角固定,不能根据搜索结果调整搜索参数,因此依然存在搜索性差的问题,而另一方面尽管收敛速度有所改观,但依然收敛速度慢。增强型量子遗传算法,在量子遗传算法中加入了自适应旋转参数,优化了收敛速度;在算法中引入交叉和变异操作,优化了算法的全局性搜索能力。但收敛速度和局部搜索能力仍然是一个关键问题。

综上所述,现有技术存在的问题是:现有的RNA二级结构预测算法中存在的收敛速度慢,搜索能力差的问题。搜索能力差往往不能协调算法全局和局部搜索能力,会使算法很容易陷入到局部极小值点,造成“早熟”现象,从而不能寻得全局最优点,从而使算法性能偏低。而收敛速度慢,则会使算法迭代次数过高,算法的执行时间过长,而使算法的执行效率低下。

解决上述技术问题的难度和意义:遗传算法中,全局搜索能力和局部搜索能力是两个“难以兼得”的能力,一个算法如果有较强的全局搜索能力,那么往往就不能兼顾局域搜索能力,反之亦然。如果将两者协调折中,那么算法又会陷入到收敛速度慢的问题。如果能很好的协调三者,既能有较强的全局搜索能力,又有较强的局域搜索能力,且收敛速度快,那么算法的准确性和运算效率就会得到很大的提高,RNA二级结构的预测准确度和算法收敛速度就会大大增加。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810220951.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top