[发明专利]基于后缀数组的字符串快速匹配方法有效
申请号: | 201810398497.5 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108920483B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 路松峰 | 申请(专利权)人: | 南京搜文信息技术有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于后缀数组的字符串快速匹配方法。该方法包括两个阶段,第一个阶段首先利用二分查找将模式串在文本串中的出现位置限定在以模式串的首字符为起始字符的后缀数组可能存在的区间内;第二个阶段再在这个区间上进一步限定查找条件,排除长度小于模式串以及末位字符与模式串末位字符不同的后缀,以减少字符的比较次数同时缩小了字符串匹配的范围,进而快速地得到模式串在文本串中的出现位置。 | ||
搜索关键词: | 基于 后缀 数组 字符串 快速 匹配 方法 | ||
【主权项】:
1.基于后缀数组的字符串快速匹配方法,其特征在于,包括如下步骤:1)建立关于文本串T的后缀数组SA,然后再对后缀数组SA进行二分查找将模式串P在文本串T中的出现位置限定在以模式串P的首字符为起始字符的后缀数组区间内[sp,ep],其中sp表示文本串T中与模式串P首字符相同的后缀的可能的起始位置,ep表示文本串T中与模式串P首字符相同的后缀的可能结束的位置;2)在步骤1)所得到的区间上排除长度小于模式串P以及末位字符与模式串P末位字符不同的后缀,进而得到模式串P在文本串T中的出现位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京搜文信息技术有限公司,未经南京搜文信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810398497.5/,转载请声明来源钻瓜专利网。