[发明专利]一种字符串匹配的方法及装置无效

专利信息
申请号: 201210013304.2 申请日: 2012-01-16
公开(公告)号: CN102929900A 公开(公告)日: 2013-02-13
发明(设计)人: 凌少平;吕雪梅 申请(专利权)人: 中国科学院北京基因组研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 100029 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 字符串 匹配 方法 装置
【权利要求书】:

1.一种字符串匹配的方法,其特征在于,包括以下步骤:

为获得的多个待匹配字符串分配不同的标识,其中一个待匹配字符串中的每个字符均对应该待匹配字符串的标识;

并行处理所述多个待匹配字符串,并针对每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标;

依据待匹配字符串的标识,将当前获得的字符的坐标合并到对应的待匹配字符串的匹配路径中;

当一个待匹配字符串中所有字符的坐标均合并时,确定该待匹配字符串与目标字符串匹配成功。

2.如权利要求1所述的方法,其特征在于,针对多个待匹配字符串中每个待匹配字符串的第一个字符,其前一个字符的坐标是初始设置的。

3.如权利要求1所述的方法,其特征在于,针对多个待匹配字符串中每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标,具体包括:

在以前一个字符的坐标为起始位置要进行匹配时,针对当前字符分配字符标识,并依据前一个字符的坐标对当前字符分别进行k和l的计算,利用当前字符的字符标识将k和l的计算结果合并得到当前字符的坐标,其中,同一字符串中的不同字符对应不同的标识,其中k和1分别是BWT空间中后缀数组间隔的开始位置和结束位置。

4.如权利要求1所述的方法,其特征在于,还包括步骤:若在字符匹配过程中匹配不成功,则分别针对错配,插入和缺失三种情况,根据与该三种情况对应的匹配策略,将当前字符继续与BWT空间中的目标字符串进行匹配。

5.如权利要求4所述的方法,其特征在于,分别针对错配,插入和缺失三种情况将当前字符继续与BWT空间中的目标字符串进行匹配之前,还包括步骤:更新匹配不成功的罚分,并判断当前的罚分是否达到预设的门限值;

若未达到门限值,则分别针对错配,插入和缺失三种情况继续与BWT空间中的目标字符串进行匹配。

6.如权利要求5所述的方法,其特征在于,在将待匹配字符串与BWT空间中的目标字符串进行匹配之前,还包括步骤:将待匹配字符串与BWT空间中的目标字符串进行初配,得到包括多个初配结果段;

在当前的罚分未达到门限值时,还包括步骤:在BWT空间中确定字符当前匹配不成功的位置后存在的初配结果段的段数,并将确定的段数与预设的门限值比较;

当段数大于预设门限值时,终止该待匹配字符串的匹配;

当段数等于预设门限值时,根据当前位置后续的初配结果段从BWT空间的所有可能的查询路径中删除相应的查询路径,从剩余查询路径中继续匹配;

当段数小于预设门限时,则在BWT空间的所有可能路径上继续匹配。

7.一种可编程逻辑装置,其特征在于,包括:

查询控制模块,用于为获得的多个待匹配字符串分配不同的标识,以及将待匹配字符串以字符为单位发送给匹配模块,并将该字符对应的标识发送给合并模块,其中一个待匹配字符串中的每个字符均对应该待匹配字符串的标识;

匹配模块,用于并行处理所述多个待匹配字符串,并针对每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标,并输出给合并模块;

合并模块,用于依据待匹配字符串的标识,将当前获得的字符的坐标合并到对应的待匹配字符串的匹配路径中,并将合并后的匹配路径输出给遍历模块;

遍历模块,用于当一个待匹配字符串中所有字符的坐标均合并时,确定该待匹配字符串与目标字符串匹配成功。

8.如权利要求7所述的装置,其特征在于,还包括:缓存模块,用于存储初始设置的坐标和获得的多个待匹配字符串。

9.如权利要求7所述的装置,其特征在于,针对多个待匹配字符串中每个待匹配字符串的第一个字符,前一个字符的坐标是初始设置的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院北京基因组研究所,未经中国科学院北京基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210013304.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top