[发明专利]海量特征串集合的匹配方法和装置有效
申请号: | 201611059646.2 | 申请日: | 2016-11-24 |
公开(公告)号: | CN106599097B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 尹延伟 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/31 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种海量特征串集合的匹配方法和装置,该方法包括根据特征串集合中的特征串所包含字符个数确定匹配窗口长度并为当前待匹配数据设置初始偏移值;根据初始偏移值为起点对当前待匹配数据进行偏移并定位,获取匹配窗口长度内以匹配窗口末端为终点,长度为预设第一长度的字符块并作为第一字符块;在第一字符块为特征串集合的子特征串时,获取匹配窗口长度内以匹配窗口始端为起始,长度为预设第二长度的字符块并作为第二字符块;计算第二字符块的转换值并读取与转换值对应的位向量作为当前匹配向量;根据当前匹配向量对当前待匹配数据进行特征串匹配。该方法能够有效利用位向量掩码表的空间,降低过滤通过率,提升匹配速度。 | ||
搜索关键词: | 海量 特征 集合 匹配 方法 装置 | ||
【主权项】:
一种海量特征串集合的匹配方法,其特征在于,包括以下步骤:接收当前待匹配数据,并生成与所述当前待匹配数据对应的字符转换函数和对应的位向量掩码表;根据特征串集合中的特征串所包含字符个数确定匹配窗口长度,并为当前待匹配数据设置初始偏移值;根据所述初始偏移值为起点对所述当前待匹配数据进行偏移并定位,获取所述匹配窗口长度内以所述匹配窗口末端为终点,长度为预设第一长度的字符块并作为第一字符块;根据预设快表判断所述第一字符块是否为所述特征串集合的子特征串;在所述第一字符块为所述特征串集合的子特征串时,获取所述匹配窗口长度内以所述匹配窗口始端为起始,长度为预设第二长度的字符块并作为第二字符块;根据所述对应的字符转换函数计算所述第二字符块的转换值,并从所述对应的位向量掩码表读取与所述转换值对应的位向量并作为当前匹配向量;根据所述当前匹配向量对所述当前待匹配数据进行特征串匹配;在所述第一字符块不为所述特征串集合的子特征串时,以当前读入的所述第一字符块的起点位置的下一位作为所述匹配窗口的起点;基于新的匹配窗口的起点对所述当前待匹配数据进行偏移并定位,并在新的所述匹配窗口的长度内对所述第一字符块进行更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611059646.2/,转载请声明来源钻瓜专利网。