[发明专利]一种用于运营商网络出口的网络报文模式匹配方法及系统有效
申请号: | 201310097942.1 | 申请日: | 2013-03-25 |
公开(公告)号: | CN103220274A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 鲁冬林;陈海涛 | 申请(专利权)人: | 北京东方网信科技股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 运营商 网络 出口 报文 模式 匹配 方法 系统 | ||
技术领域
本发明涉及一种解决在复杂环境下导致模式匹配算法效率降低的优化算法,适用于使用模式匹配算法实时识别网络报文的应用场景,特别适用于部署在运营商网络出口实时识别并处理大量网络报文的应用场景,即本发明提供一种用于运营商网络出口的网络报文模式匹配方法及系统。
背景技术
网络运营商的网络出口是网内用户出网请求数据报文的汇聚点,请求报文数量巨大,如果要在网络出口部署监听设备对用户的请求报文进行实时监听并分析,要求该监听设备具有非常高效的模式匹配算法,否则将会由于处理效率不高导致大量报文来不及处理而被丢弃,造成网络报文分析和处理效果不理想。采用传统的模式匹配算法对用户请求的URL字符串进行模式匹配,一个模式匹配失败后,执行下一个模式匹配时需要回溯到前一个模式的起始字符位置重新进行匹配,造成对字符串执行重复的比较,当需要匹配的模式比较多时,会导致处理效率急剧下降,从而影响处理设备整体的性能表现。
发明内容
本发明的目的是提供一种解决在数据量大、模式较多的情况下提高模式匹配处理效率的算法,使用这种方法后,可以将复杂度非常高的字符串比较转化为单纯的数字比较,使处理效率得到极大提升,从而达到在运营商网络出口实时分析和处理用户上网请求的目的。
为实现上述目的,本发明提供了一种用于运营商网络出口的网络报文模式匹配方法,该方法用于对运营商网络出口处用户请求的URL与缓存系统需要识别并处理的URL进行模式匹配,所述方法包含:
步骤101)统计URL的所有特征,基于统计特征将URL包含的由分隔符分割的字符串共分为M类,并采用自定义的若干个数值描述M类中的每一类字符串;
步骤102)将缓存系统需要识别和处理的URL元数据进行分析,并基于某一类分隔符将URL元数据划分为若干字符串,将得到的各个字符串划分至M类中的某一类同时采用自定义的数值描述各字符串的具体类别,最后统计每个字符串包含的字符的数量并采用自定义的数值记载字符数量;
步骤103)对运营商网络出口监听到的URL请求进行一次扫描,并将监听到的URL元数据进行与上步骤针对URL元数据相同的处理,得到监听到的URL请求包含的各字符串的数值化的类别和数值化的各字符串包含的字符数量;
步骤104)将步骤103)得到的URL请求各字符串的数值化的类别和数值化的各字符串包含的字符数量同时与步骤102)得到的缓存系统需要识别和处理的URL包含的字符串类别和各类别包含的字符数量进行比较,最终判定监听到的URL是否属于缓存系统需要识别并处理的URL;
其中,所述URL的特征包含:字母、数字和分隔符。
上述步骤102)进一步包含:
步骤102-1)统计缓存系统需要识别和处理的URL元数据的特征,可知URL信息的组成字符具体包含:字母、数字或分隔符,并基于某一类分隔符将所述URL分割为若干字符串;
步骤102-2)定义数据结构描述各字符串属性,具体为;
所述数据结构包含样式mode和数量quantity两部分,其中,所述样式mode部分采用若干位自定义的二进制序列记录URL中被分隔符分割的各个字符串的具体类型,且所述字符串的具体类型分为如下三类:26个大写或小写的英文字母,十进制数字“0-9”和十六进制数字“0-9和a-f”;所述数量quantity部分用于采用若干位自定义的二进制序列记录URL中被分隔符分割的各个字符串包含的字符的个数;
其中,所述样式中自定义的二进制序列的长度与所要表示的字符串的个数以及字符串种类的个数相关,所述数量中采用的二进制序列的长度与字符串个数及各字符串中包含最长字符的具体长度相关。
上述步骤103)进一步包含:
步骤103-1)将运营商网络出口监听到的URL请求进行一次扫描获得被分隔符分割的各字符串的特征,将各个字符串依据步骤101)定义的类型划分为某一类;
步骤103-2)依据步骤101-2)定义的数据结构和二进制序列将监听到的URL请求包含的各字符串所属的类型和长度进行赋值操作,获得监听到的URL请求的数据结构中的样式和数量的初始值。
上述步骤104)进一步包含:
步骤104-1)将步骤103-2)中得到的数据结构中的样式mode和数量quantity变量分别与步骤102-2)中得到的数据结构中的样式mode和数量quantity变量进行“与”操作,得到待比较的样式mode和数量quantity变量值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京东方网信科技股份有限公司,未经北京东方网信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310097942.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于涡轮增压器的变截面调速环
- 下一篇:高铁含量的三维立体蒸镀掩模板