[发明专利]一种基于多目标人工蜂群算法的生物多序列对比方法在审

专利信息
申请号: 201710576125.2 申请日: 2017-07-14
公开(公告)号: CN107451426A 公开(公告)日: 2017-12-08
发明(设计)人: 匡芳君;张思扬;周文俊 申请(专利权)人: 温州商学院
主分类号: G06F19/22 分类号: G06F19/22;G06N3/00;G06N3/12
代理公司: 温州名创知识产权代理有限公司33258 代理人: 陈加利
地址: 325000 浙江省温州市瓯海*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多目标人工蜂群算法的生物多序列对比方法,其技术方案是即先构建多序列比对多目标优化模型,再利用新的多目标人工蜂群算法去优化多序列比对多目标优化模型本发明实施例,基于多目标人工蜂群算法,具有较强的全局探索能力和局部开采能力,收敛速度快,能获取较好的多序列比对性能和生物特性。
搜索关键词: 一种 基于 多目标 人工 蜂群 算法 生物 序列 对比 方法
【主权项】:
一种基于多目标人工蜂群算法的生物多序列对比方法,其特征在于:所述方法包括以下步骤:步骤1:设置多序列对比方法的初始参数,包括预先设定种群规模M、最大迭代次数Gmax、蜜源开采限制次数Limit以及当前迭代次数iter=0;步骤2:对蜜源进行初始化及个体编码,并随机产生M个引领蜂;设有N条序列参与比对,各条序列的长度依次为l1,l2,Λ,lN,并随机产生lmax和1.2lmax之间的随机数L作为比对后序列的长度;其中lmax=max(l1,l2,Λ,lN);根据预设的序列比对的数学模型,将每条序列需要插入的空位数分别设为L‑li,并随机生成N个1到L‑li随机排列的一维矩阵αi后采用二维矩阵进行个体编码,得到每一个蜜源的编码为γ=[a1,a2,Λ,aN];其中,一维矩阵中存储的是各条序列所需插入空位的位置,在输入比对结果时将蜜源编码转化成对应的比对并以二维矩阵的形式存储;1≤i≤N;确定随机产生的M个引领蜂及其对应的序列长度和序列;步骤3:确定种群当前最优蜜源位置Ebest;对每一个随机产生的引领蜂均根据下述公式(4)进行计算,计算出目标函数f1(Si)和f2(Si);其中,minimizeF(S′)=(f1(S′),f2(S′))Tf1(S′)=-Score(S′)f2(S′)=g(S′)S′∈Ω---(4)]]>式(4)中,g(S')=n1×gopen+n2×gextend表示对齐序列组S'的空位罚分,n1,n2分别为空位开放的数量和空位扩展的数量;Ω表示多序列比对空间;令F1=(f1(S1),f1(S2),Λ,f1(SL)以及F2=(f2(S1),f2(S2),Λ,f2(SL),则计算出F=(min(F1),min(F2)),并记录种群当前最优蜜源位置Ebest;步骤4:通过种群当前最优蜜源位置Ebest对每一个随机产生的引领蜂进行单点交叉操作产生新的引领蜂Vi;步骤5:按步骤3中的公式(4)计算每一个随机产生的引领蜂的适应度值F(Ei)及其对应新引领蜂的适应度值F(Vi)并进行比较;如果F(Vi)<F(Ei),则用新引领蜂Vi的序列比对替代及其对应的随机产生的引领蜂Ei的序列比对;否则继续保持随机产生的引领蜂Ei的原始序列比对不变;步骤6:对步骤5中所得的引领蜂的适应度值从小到大进行排序,再根据锦标赛选择策略式(7),计算排序后的选择概率Pi(t);Pi(t)=ci(t)Σi=1Nci(t).---(7)]]>其中ci为每个个体的得分;步骤7:跟随蜂根据步骤6中所得的选择概率Pi(t)选择蜜源,当一个引领蜂被选择作为蜜源时,跟随蜂在引领蜂邻域位置通过变异操作产生一个新的蜜源位置,引入一个新的变异操作,步骤如下:步骤7.1:移动空位组:对各条序列随机选取一个空位组,对该空位组向左或向右移动一个残基位;步骤7.2:合并空位组:先随机选择一条序列,接着在此序列中随机选择的一组空位,并将它和最近的空位组合并;步骤7.3:划分空位组:先随机选择一条序列,接着在此序列中随机选择的一组空位,并将此空位组划分成两个大小相等的空位组;步骤7.4:删除全为空位的列,产生新的蜜源位置;步骤8:按步骤3中的公式(4),计算每一个所选引领蜂的适应度值及其对应产生的新蜜源位置的适应度值F(Vi/)并进行比较,如果F(V/i)<F(E/i),则用新蜜源位置的序列比对替代及其对应所选引领蜂的序列比对,且设置开采度标志向量trial(i)=0;否则保持所选引领蜂的原始序列比对不变,且设置开采度标志向量trial(i)=trial(i)+1;步骤9:判断trial(i)是否大于Limit,若trial(i)>Limit,则第i个引领蜂放弃当前蜜源而成为侦察蜂,侦察蜂按照如下局部搜索策略对种群进行搜索产生一个新的蜜源替代蜜源,步骤9.1:随机选取序列中某个块,块大小为序列长度的[5%‑25%]之间;步骤9.2:删除被选中块的所有空位;步骤9.3:对被选中块利用Kalign2比对算法重新产生比对结果;步骤9.4:用Kalign2比对算法产生的新的比对结果替代原序列中的选中块,即得到一个新的蜜源;步骤10:按步骤3中的公式(4)计算步骤9中所得各个蜜源的适应度值,并保存前M个最优蜜源作为下一次迭代的引领蜂;步骤11:更新迭代次数iter=iter+1,判断是否达到最大迭代次数Gmax,如满足,则输出最优解,否则返回步骤4。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州商学院,未经温州商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710576125.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top