[发明专利]一种SWM技术的域名过滤方法在审
申请号: | 201710016445.2 | 申请日: | 2017-01-10 |
公开(公告)号: | CN108289083A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 长沙云昊信息科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410011 湖南省长沙市芙蓉区朝*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 域名过滤 多模式 多模式匹配算法 网络数据处理 模式冲突 匹配模式 匹配顺序 确认机制 分集 匹配 应用 优化 跳跃 膨胀 | ||
本发明公开了基于SWM技术的域名过滤方法,本方法在多模式匹配算法中提出模式分集思想并优化了跳跃和确认机制,设计了SWM算法;然后针对该算法在域名过滤中的应用,对hash函数、匹配顺序等进行进一步优化;SWM算法是一种有效的多模式匹配方法,当模式集规模大或模式冲突率高时,算法的性能更优,更适合当前网络数据处理领域多模式匹配模式集不断膨胀的应用现实。
技术领域
本发明是一种网络安全技术领域,使用了SWM技术。
背景技术
随着网络技术的发展,互联网在人们日常生活中的作用越来越大,同时挂马网页、诈骗网页、色情网页等非法网站也给正常的网络秩序带来了巨大的挑战;本方法可以对非法网站的域名进行过滤,保证了人们的电脑安全。
发明内容
SWM算法在域名过滤方法如下:
SWM算法适合在模式集规模大且最短模式长度小的情况下使用,而域名过滤问题中由于域名结构的特殊性,其后缀的Hash冲突概率非常高,相当于模式集规模大的情况,因此将SWM算法应用在域名过滤问题中,并在实现过程中做了部分改进,
域名过滤中的多模式匹配问题是实现对每一条输入的域名,判断模式集P中是否有模式与其匹配,SWM算法应用在域名过滤时,根据域名字符串的特点,通过以下两点来完成;
1.hash1函数的性能对算法整体性能的影响,Hash1函数的功能是计算B个字符的hash值,在每次匹配中要多次使用,对性能影响较大,域名中的合法字符包含英文字母a-z(不区分大小写),阿拉伯数字0-9,以及“,”和“一”其ASCII值分别为OX61-OX7A, OX30-0X39,OX2E, OX2D,其值的区别主要在低位的5比特,因此hash1函数可以直接取每个字符的低位5比特组合构成hash值,运算简单;
2.域名顺序对hash冲突概率的影响,域名的结尾是各级类属域的标号,对于后缀匹配的SWM算法而言,相同的标号会造成跳跃距离为0,降低了算法效率,因此在预处理和匹配阶段,首先将域名倒序,相当于使用域名的前缀建立跳转表,减少了冲突概率和确认比较次数,如域名abcd,edu,com,cn,正常顺序处理时,若m=6,使用后缀“com,cn”建立跳转表,会产生大量的冲突确认计算量,而倒序后为nc,moc,ude, dcba,使用“e,dcba”建立跳转表,减少了冲突机会,能够大幅提高处理速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙云昊信息科技有限公司,未经长沙云昊信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710016445.2/2.html,转载请声明来源钻瓜专利网。