[发明专利]规则匹配的优化方法及装置在审
申请号: | 202210439731.0 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114785601A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 许可嘉 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 规则 匹配 优化 方法 装置 | ||
本发明提供一种规则匹配的优化方法和装置,该方法包括:根据初始规则集中各个规则的初始权重划分初始规则集为第一规则集和第二规则集;将各个待识别报文分别与第一规则集中的各个规则进行匹配,再将未与第一规则集中各个规则匹配成功的各个待识别报文与第二规则集中的各个规则进行匹配,统计各个规则的匹配成功次数;根据各个规则的匹配成功次数和初始权重,计算各个规则的第一权重;当第一规则集的过滤状态值小于过滤状态下降阈值时,根据各个规则的第一权重,调整第一规则集和第二规则集,直至调整后的第一规则集的过滤状态值不小于过滤状态下降阈值。应用该方法,可以减小匹配规则集的规模,优化规则匹配的过程,提高规则匹配性能。
技术领域
本发明涉及数据处理的技术领域,特别是涉及一种规则匹配的优化方法及装置。
背景技术
随着银行数字化进程的不断加快和银行业务量的不断上升,与银行业务相关的数据流量急剧增长,对银行数据流量进行识别能够帮助银行识别恶意流量攻击,保护银行数据安全。
Hyperscan作为一个高性能的正则引擎,可以将待识别的数据与预设规则集中的各个规则进行多模式匹配,以实现对银行数据流量的识别。但是,随着银行数据流量的增长,需要进行识别的数据量及其相应的规则集的规模也会随之增大,成为系统吞吐量的瓶颈,而规则集中各个规则冗杂,使得Hyperscan匹配性能下降。
发明内容
有鉴于此,本发明提供一种规则匹配的优化方法,通过该方法,可以减小规则匹配过程中规则集的规模,减少匹配次数,提高规则匹配性能。
本发明还提供了一种规则匹配的优化装置,用以保证上述方法在实际中的实现及应用。
一种规则匹配的优化方法,包括:
获取预设的初始规则集,所述初始规则集包含各个规则;
确定每个所述规则的初始权重,并根据各个所述规则的初始权重,将所述初始规则集中的各个所述规则按照预设的划分规则进行划分,生成第一规则集和第二规则集;
获取各个待识别报文,并基于各个所述待识别报文,执行规则匹配的过程,得到各个所述规则的匹配成功次数;
其中,规则匹配的过程包括:将每个所述待识别报文与所述第一规则集中的各个规则分别进行匹配;若该待识别报文与所述第一规则集中的任一规则满足预设的匹配条件,则该规则的匹配成功次数加一;若该待识别报文与所述第一规则集中的所有规则均不满足所述匹配条件,则将该待识别报文与所述第二规则集中的各个规则分别进行匹配,当该待识别报文与所述第二规则集中的任一规则满足所述匹配条件时,该规则的匹配成功次数加一;
根据各个所述规则的初始权重以及各个所述规则的匹配成功次数,计算各个所述规则的第一权重;
若当前所述第一规则集的过滤状态值小于预设的过滤状态下降阈值,则根据当前各个所述规则的第一权重,调整当前所述第一规则集和所述第二规则集,直至调整后的第一规则集过滤状态值不小于所述过滤状态下降阈值。
上述的方法,可选的,所述调整当前所述第一规则集和所述第二规则集,包括:
获取当前所述第二规则集中的各个高活跃规则,各个所述高活跃规则组成待评估规则集,所述高活跃规则为第一权重大于预设权重阈值的规则;
根据当前所述第一规则集中各个规则的第一权重的大小,对所述第一规则集中的各个规则进行排序,并基于倒数序列取出预设数量的规则放入所述第二规则集中,得到预调整后的第一规则集和预调整后的第二规则集;
评估所述待评估规则集中的各个高活跃规则是否满足预设的二级规则,并将所述预调整后的第二规则集中满足所述二级规则的各个高活跃规则取出,同时将取出的各个所述高活跃规则放入所述预调整后的第一规则集中,得到调整后的第一规则集和调整后的第二规则集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210439731.0/2.html,转载请声明来源钻瓜专利网。