[发明专利]基于变邻域搜索的DNA标签的构造方法有效
申请号: | 201510181373.8 | 申请日: | 2015-04-16 |
公开(公告)号: | CN104751016B | 公开(公告)日: | 2018-03-27 |
发明(设计)人: | 王宾;周昌军;张强 | 申请(专利权)人: | 大连大学 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;C12Q1/6869 |
代理公司: | 大连创达专利代理事务所(普通合伙)21237 | 代理人: | 温宏梅 |
地址: | 116622 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及DNA标签的构造方法,具体讲是涉及一种基于变邻域搜索的DNA标签的构造方法,其首先生成全部的DNA标签,然后根据部分约束条件去除部分不满足要求的DNA标签,构造出DNA标签全部解空间。接着利用DNA标签间的最大编辑距离之和来构造初始邻域解空间,然后根据该局部DNA标签集合,得到剩余DNA标签解空间。在剩余解空间中,同样的依据最大距离之和构造下一个邻域,找出该邻域内的DNA标签集合,与之前的DNA标签集合合并,再利用排除算法消除部分不符合要求的解。以此类推,直到搜索完全部解空间,合并每个邻域生成的DNA标签集合,最终构造出的完整的DNA标签集合。该方法在确保局部最优解准确性的同时,提高了计算的效率。 | ||
搜索关键词: | 基于 邻域 搜索 dna 标签 构造 方法 | ||
【主权项】:
基于变邻域搜索的DNA标签的构造方法,其特征在于:首先根据全部约束条件组合构造出全部的DNA标签,再根据部分约束条件去除部分不满足要求的DNA标签,构造出满足组合约束条件的DNA标签全部解空间;接着以DNA标签的最大编辑距离之和为准则,构建邻域解空间,并在该解空间中使用穷举算法构造出该邻域的局部DNA标签集合;利用已经得出的局部DNA标签集合,利用排除算法消除剩余空间中不符合要求的解,得到剩余DNA标签解空间,并在该空间中继续以最大编辑距离之和为准则,构造下一个邻域空间,求出下一个局部DNA标签集合;搜索完所有的DNA标签空间后,组合所有的局部DNA标签集合,构造出最优DNA标签集合;所述的方法的具体步骤如下:步骤1:确定DNA标签的构造所选的全部约束条件,将各个约束条件组合,建立组合约束条件;步骤2:依据GC含量约束、完全自补约束和连续性约束这三条约束条件,对全部DNA标签进行删除,去除不满足这三条的DNA标签,构造全部DNA标签解空间;步骤3:计算每个DNA标签与其他DNA标签之间的编辑距离,并把所有的距离相加求和,找出其中的最大值,并以这些DNA标签来构造邻域解空间,在该解空间里使用穷举算法构造出该邻域内的局部最优DNA标签集合;步骤4:计算局部最优集合中的标签与步骤2中全部解空间中的标签的编辑距离,将不满足编辑距离约束的DNA标签从全部DNA标签解空间中剔除,得到剩余DNA标签解空间;步骤5:在剩余解空间中,依据步骤3中的方法构造下一个邻域,并找出该邻域内的局部最优DNA标签集合,与之前的DNA标签集合合并,再利用步骤4中的排除方法消除部分不符合要求的解;步骤6:重复步骤3‑5,直到搜索完全部解空间,合并每个邻域生成的DNA标签集合,最终构造出的最优DNA标签集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510181373.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用