[发明专利]一种多模式串匹配方法和系统有效

申请号：	201510236364.4	申请日：	2015-05-11
公开（公告）号：	CN104881439B	公开（公告）日：	2019-03-22
发明（设计）人：	张萍;刘燕兵;谭建龙;郭莉	申请（专利权）人：	中国科学院信息工程研究所
主分类号：	G06F16/903	分类号：	G06F16/903;G06F16/908
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	余功勋
地址：	100093 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种空间高效的多模式串匹配方法和系统。首先提出了一种新的存储模式串的数据结构—HashTrie，利用位向量表将原模式串矩阵存储为一维表的形式，避开传统方法存储自动机的状态转移矩阵问题；利用递归的哈希函数方法求出这个特殊的位向量表，以达到节约存储空间的目的；在哈希函数计算过程中，利用位运算技巧，将其转化为简单高效的位与运算操作；另外在HashTrie构造和关键词查找过程中均使用Rank技术，提高了搜索的空间效率和时间效率。本发明极大地降低了内存开销和预处理时间，更能满足实时入侵检测系统对规则生效的时效性要求，更适合于模式串集合规模较大、模式串长度较短的多模式串实时匹配问题。
搜索关键词：	一种空间高效模式匹配方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种模式串的数据存储结构的构建方法，其特征在于，所述数据存储结构包括过滤散列表B、预匹配散列表F和校验散列表M，其中过滤散列表B、预匹配散列表F是两个位向量表，该方法包括以下步骤：1)读入关键词文件；2)对关键词文件进行规范化处理；3)对于规范化处理之后的关键词文件，给位向量表的长度H赋值，并初始化位向量表B和位向量表F；步骤3)包括以下子步骤：3.1)给位向量表的长度H赋值，其中|P|＝∑_p∈P|p|是所有模式串的长度之和，其中p表示一个模式串，P表示模式串集合；3.2)初始化位向量表B，将B的H个位置均置为0；3.3)初始化位向量表F，将F的H个位置均置为0；4)采用递归哈希函数计算过滤散列表B和预匹配散列表F两个位向量表，利用Rank技术计算校验散列表M，最终得到B、F、M；步骤4)中，对于给定模式串集合P＝{p(0),p(1),…,p(r‑1)}，B、F的构造过程如下：4.1)对每一个模式串的每一个前缀其中0≤k＜r,1≤j≤m_k，利用递归哈希函数计算该前缀的哈希值h＝Hash(u)，同时将位向量B中第h位置为1；其中r表示模式串个数，m_k表示第k个模式串的长度为m_k，也即第k个模式串一共包括m_k个字符，表示第k个模式串的第1,2,…,m_k个字符；4.2)对于每一个完整的模式串，除了在位向量B中标记其哈希值外，同时将其标记在另一个位向量F中，即将F中对应的第h位亦置为1，得到位向量F，以此记录完整模式串的信息；步骤4)中校验散列表M是一个数组，每个数组元素M[t]为一个链表，M的构造过程如下：4‑3)对于模式串集合P＝{p(0),p(1),…,p(r‑1)}中的每一个模式串p(k)，计算该模式串的哈希值h：其中a是Borland C/C++编译器中伪随机数生成器的参数；4‑4)利用Rank技术，计算位向量F中第h比特位在F中的次序t，然后将该模式串存入链表M[t]中，t＝Rank(F,h),M(t)＝k。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所，未经中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510236364.4/，转载请声明来源钻瓜专利网。

上一篇：基于局域网的文件接收及存储方法、查看方法及系统
下一篇：一种存储遥感影像的方法和系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多模式串匹配方法和系统有效

专利文献下载