[发明专利]URL匹配方法、URL匹配设备及存储介质有效
申请号: | 201710451043.5 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107402959B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 卢毓海;张春燕;刘燕兵;谭建龙;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955;G06F16/901 |
代理公司: | 11200 北京君尚知识产权代理有限公司 | 代理人: | 邵可声 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | url 匹配 方法 设备 存储 介质 | ||
1.一种URL匹配方法,其步骤为:
1)首先为URL结果缓存开辟一块内存,将待匹配的原始URL数据进行双哈希运算,得到双哈希值hash1、hash2及其对应的哈希值h;
2)若在哈希表中查询到哈希值为h的哈希节点,则查询该哈希节点的双哈希值与上述待匹配的原始URL数据的双哈希值是否都相等;
3)若相等,则判断上述哈希节点的标志位start和end是否满足预设条件;
4)若上述哈希节点的标志位start和end满足预设条件,则上述待匹配的原始URL数据匹配已命中规则表中的一条规则。
2.如权利要求1所述的方法,其特征在于,步骤2)中所述哈希表与步骤4)中所述已命中规则表位于URL结果缓存中。
3.如权利要求1所述的方法,其特征在于,步骤2)还包括:若在哈希表中未查询到哈希值为h的哈希节点,则直接结束,转到模式匹配引擎匹配所述待匹配的原始URL数据,并返回结果。
4.如权利要求1所述的方法,其特征在于,步骤3)中所述预设条件是指哈希节点的标志位start和end不相等。
5.如权利要求2所述的方法,其特征在于,步骤3)还包括:若上述哈希节点的双哈希值与上述待匹配的原始URL数据的双哈希值不相等,则在上述哈希表中查询是否还有其它哈希值为h的哈希节点;若没有则利用模式匹配引擎匹配所述待匹配的原始URL数据,并返回结果。
6.如权利要求5所述的方法,其特征在于,当模式匹配引擎匹配所述待匹配的原始URL数据,并返回结果时,将该待匹配的原始URL数据存入URL结果缓存,其步骤包括:
a)判断URL结果缓存中的URL数据数目J是否超出阈值M,若未超出,则将该待匹配的原始URL数据的双哈希值hash1、hash2记录到当前哈希节点hash_node[J]中;若超出,则对该内存URL结果缓存采取替换策略;其中M为能缓存的URL数据大小;
b)当模式匹配引擎返回结果为0时,则该哈希节点hash_node[J]中的标志位hash_node[J].start=hash_node[J].end=K;当模式匹配引擎返回结果为1时,则该哈希节点hash_node[J]中的标志位hash_node[J].start=K、hash_node[J].end=K+1,并在matched_rules[]中存储从模式匹配引擎返回的匹配规则号matched_rules[K]=RuleId,此时K=K+1;其中0代表该待匹配的原始URL数据不匹配规则,1代表该待匹配的原始URL数据匹配规则,K为已匹配的规则数目,matched_rules[]代表已命中规则表;
c)获取上述待匹配的原始URL数据的哈希值h,存储哈希值相同的哈希节点到next中,且存储的URL数据数目J=J+1。
7.如权利要求6所述的方法,其特征在于,步骤a)中所述替换策略是指:对该内存URL结果缓存清零,重新分配空间存储新的URL数据。
8.如权利要求1或6所述的方法,其特征在于,所述待匹配的原始URL数据的哈希值h根据hash1与(N-1)做与运算得到,其中N为哈希表大小。
9.如权利要求1所述的方法,其特征在于,步骤4)还包括:若上述哈希节点的标志位start和end不满足预设条件,则上述待匹配的原始URL数据不匹配规则。
10.如权利要求1所述的方法,其特征在于,步骤4)中所述规则是指与上述哈希节点的哈希值所对应数据匹配的规则。
11.如权利要求1所述的方法,其特征在于,所述双哈希运算采用多项式散列算法,并采用多线程的方法并行对URL数据进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710451043.5/1.html,转载请声明来源钻瓜专利网。