[发明专利]一种基于FPGA平台的压缩流量模式匹配引擎及模式匹配方法有效
申请号: | 201910950410.5 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110865970B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 胡成臣;孙秀文;乔思祎;李昊 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;H03M7/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 郭瑶 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpga 平台 压缩 流量 模式 匹配 引擎 方法 | ||
本发明公开了一种基于FPGA平台的压缩流量模式匹配引擎及模式匹配方法,设计高效的基于FPGA平台的实现方案,实现加速匹配压缩流量的效果。一种基于FPGA平台的压缩流量模式匹配引擎包含输入队列、输出队列、环存储区和结果记录四个数据存储功能模块,以及匹配模块和数据搬运和读写模块。本发明的技术方案不仅能够提升引擎处理压缩流量时的吞吐率,还有效降低了处理时延。
技术领域
本发明属于压缩流量的模式技术领域,具体涉及一种对使用gzip/DEFLATE压缩编码的HTTP等网络流量,基于FPGA平台的压缩流量模式匹配引擎及模式匹配方法。
背景技术
随着压缩技术在网络流量中的广泛应用,越来越多的Web服务将数据内容压缩后再发送。文献[1](Sun X,Hou K,Li H,et al.Towards a fast packet inspection overcompressed HTTP traffic[C]//Quality of Service(IWQoS),2017 IEEE/ACM 25thInternational Symposium on.IEEE,2017:1-5.)指出2010年7月Alexa Top 1000的站点中有66%的HTTP服务器使用了压缩技术,而2016年10月的Top 500站点中,该比例已超过95%。,而gzip是HTTP的默认编码方式,这些压缩流量的压缩率仅为20%左右。
另一方面,由于正则表达式能够表达更深层次的语义,被越来越多的基于深度包检测(Deep Packet Inspection,DPI)的系统和工具采用,用以识别流量中的特征或行为。例如入侵检测系统、网络取证、防火墙等。这些系统面对压缩流量时,通常采用朴素的Naive方法,也就是先解压缩流量,之后再逐字节地对解压后的数据进行模式匹配。该方法思路和实现最为简单,但由于压缩的存在,使得系统的吞吐率大大降低,成为系统的性能瓶颈。例如,20%的压缩率意味着处理100MB的压缩流量,在解压后需要处理的数据体积将变为500MB,即使忽略解压缩所需时间,此时系统的吞吐率也将降为处理未压缩流量时的1/5。
目前,有许多关于多模式匹配的相关专利,如:文献[2]申请号为201010232463.2的一种多字符串匹配方法,文献[3],申请号为200710099389.X的一种多字符串匹配方法和芯片;文献[4],申请号为201310159057.1的基于后缀自动机正则引擎构造的深度包检测方法;文献[5],申请号为200610089420.7的一种自适应多模式匹配方法及系统。但它们均没有专门涉及加速针对压缩流量的多模式匹配。一些针对HTTP压缩流量进行DPI的研究工作,例如,文献[6]Accelerating Multi-pattern Matching on Compressed HTTP Traffic,IEEE/ACM Transactions on Networking 20.3(2009):970-983;文献[7]美国专利:US8458354,Multi-pattern matching in compressed communication traffic;文献[8]中国专利CN107277109A,针对压缩流量的多字符串匹配方法,都是通过先解压流量,之后利用解压过程中所保存的信息,在匹配过程跳过对部分字符的扫描,以加速模式匹配的过程。然而他们只能对压缩流量进行多字符串扫描,而不能应用于正则表达式的匹配中,进而也限制了应用场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950410.5/2.html,转载请声明来源钻瓜专利网。