[发明专利]一种面向WEB木马检测的网页特征提取方法有效

申请号：	201610297843.1	申请日：	2016-05-06
公开（公告）号：	CN106022126B	公开（公告）日：	2018-07-24
发明（设计）人：	玄世昌;杨武;王巍;苘大鹏;位爱伶	申请（专利权）人：	哈尔滨工程大学
主分类号：	G06F21/56	分类号：	G06F21/56;G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	150001 黑龙江省哈尔滨市南岗区***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供的是一种面向WEB木马检测的网页特征提取方法。包含数据获取、页面解析、脚本解析和特征提取四个阶段。数据获取阶段包括：数据包在网关处的获取以及记录存取该数据包方法。页面解析阶段：利用正则匹配方式获取网页标签以及链接。脚本解析阶段：对网页中的脚本利用脚本解析引擎以及对其的改进获取脚本中相应的链接及函数关系。特征提取阶段：统计页面标签特征，并计算重定向链中存在的特征。本发明的方法提取有效的标签元素信息，获取重定向链接特征以及相应的页面特征，省略不必要的元素审查。具有较高的建模效率。该模型在提取过程中采用正则匹配以及脚本引擎方式，具有较高的提取速度。可以在浏览器以及网关处都能发挥其重要作用。
搜索关键词：	一种面向 web 木马检测网页特征提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向WEB木马检测的网页特征提取方法，其特征是：步骤1：数据获取；步骤11：当用一个客户端用户通过浏览器请求访问网页，系统捕获数据包后，首先判断该请求的客户端IP是否在请求链中；步骤12：如果请求的客户端IP没有在请求链中，则将该请求的客户端IP加入到客户端请求链中；利用四元组hash记录下用户的该条访问的URL；然后将数据包转发给WEB服务器；步骤13：如果该请求的客户端IP已经存在则提取数据包中的请求URL，判断该URL是否是从网页中提取的URL；如果是则利用该请求的四元组hash计算保持其URL，然后再转发数据包给WEB服务器；步骤14：WEB服务器返回响应时数据包处理；步骤2：页面解析；步骤21：利用正则匹配的方式匹配网页中的标签下的自动跳转的URL；步骤22：利用正则表达式提取网页中的script脚本，以及script脚本中src的URL链接；步骤3：脚本解析；步骤31：将存在混淆的代码利用脚本引擎解混淆，然后提取脚本中存在的重定向链接；步骤32：同时统计脚本中存在的特征函数的数量；步骤4：提取特征；步骤41：重定向链特征提取过程；步骤42：页面统计特征提取。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学，未经哈尔滨工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610297843.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向WEB木马检测的网页特征提取方法有效

专利文献下载