[发明专利]一种字符串匹配的方法及装置无效
申请号: | 201210013304.2 | 申请日: | 2012-01-16 |
公开(公告)号: | CN102929900A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 凌少平;吕雪梅 | 申请(专利权)人: | 中国科学院北京基因组研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符串 匹配 方法 装置 | ||
1.一种字符串匹配的方法,其特征在于,包括以下步骤:
为获得的多个待匹配字符串分配不同的标识,其中一个待匹配字符串中的每个字符均对应该待匹配字符串的标识;
并行处理所述多个待匹配字符串,并针对每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标;
依据待匹配字符串的标识,将当前获得的字符的坐标合并到对应的待匹配字符串的匹配路径中;
当一个待匹配字符串中所有字符的坐标均合并时,确定该待匹配字符串与目标字符串匹配成功。
2.如权利要求1所述的方法,其特征在于,针对多个待匹配字符串中每个待匹配字符串的第一个字符,其前一个字符的坐标是初始设置的。
3.如权利要求1所述的方法,其特征在于,针对多个待匹配字符串中每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标,具体包括:
在以前一个字符的坐标为起始位置要进行匹配时,针对当前字符分配字符标识,并依据前一个字符的坐标对当前字符分别进行k和l的计算,利用当前字符的字符标识将k和l的计算结果合并得到当前字符的坐标,其中,同一字符串中的不同字符对应不同的标识,其中k和1分别是BWT空间中后缀数组间隔的开始位置和结束位置。
4.如权利要求1所述的方法,其特征在于,还包括步骤:若在字符匹配过程中匹配不成功,则分别针对错配,插入和缺失三种情况,根据与该三种情况对应的匹配策略,将当前字符继续与BWT空间中的目标字符串进行匹配。
5.如权利要求4所述的方法,其特征在于,分别针对错配,插入和缺失三种情况将当前字符继续与BWT空间中的目标字符串进行匹配之前,还包括步骤:更新匹配不成功的罚分,并判断当前的罚分是否达到预设的门限值;
若未达到门限值,则分别针对错配,插入和缺失三种情况继续与BWT空间中的目标字符串进行匹配。
6.如权利要求5所述的方法,其特征在于,在将待匹配字符串与BWT空间中的目标字符串进行匹配之前,还包括步骤:将待匹配字符串与BWT空间中的目标字符串进行初配,得到包括多个初配结果段;
在当前的罚分未达到门限值时,还包括步骤:在BWT空间中确定字符当前匹配不成功的位置后存在的初配结果段的段数,并将确定的段数与预设的门限值比较;
当段数大于预设门限值时,终止该待匹配字符串的匹配;
当段数等于预设门限值时,根据当前位置后续的初配结果段从BWT空间的所有可能的查询路径中删除相应的查询路径,从剩余查询路径中继续匹配;
当段数小于预设门限时,则在BWT空间的所有可能路径上继续匹配。
7.一种可编程逻辑装置,其特征在于,包括:
查询控制模块,用于为获得的多个待匹配字符串分配不同的标识,以及将待匹配字符串以字符为单位发送给匹配模块,并将该字符对应的标识发送给合并模块,其中一个待匹配字符串中的每个字符均对应该待匹配字符串的标识;
匹配模块,用于并行处理所述多个待匹配字符串,并针对每个待匹配字符串的每一个字符,依据BWT搜索算法,以前一个字符的坐标为起始位置与BWT空间中的目标字符串进行匹配,并在字符匹配成功时获得当前字符的坐标,并输出给合并模块;
合并模块,用于依据待匹配字符串的标识,将当前获得的字符的坐标合并到对应的待匹配字符串的匹配路径中,并将合并后的匹配路径输出给遍历模块;
遍历模块,用于当一个待匹配字符串中所有字符的坐标均合并时,确定该待匹配字符串与目标字符串匹配成功。
8.如权利要求7所述的装置,其特征在于,还包括:缓存模块,用于存储初始设置的坐标和获得的多个待匹配字符串。
9.如权利要求7所述的装置,其特征在于,针对多个待匹配字符串中每个待匹配字符串的第一个字符,前一个字符的坐标是初始设置的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院北京基因组研究所,未经中国科学院北京基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210013304.2/1.html,转载请声明来源钻瓜专利网。