[发明专利]一种基于聚合度分析的暗链检测技术有效
申请号: | 201710846340.X | 申请日: | 2017-09-19 |
公开(公告)号: | CN107729386B | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 陈建勇;范渊 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 杭州中成专利事务所有限公司 33212 | 代理人: | 周世骏 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及网络安全领域,旨在提供一种基于聚合度分析的暗链检测技术。该种基于聚合度分析的暗链检测方法,通过下述步骤实现检测网页中植入的暗链:向待检测的Web网站服务器发送HTTP请求,抓取待检测页面的响应HTML源代码;对获得的响应HTML源代码建立链接坐标平面图;计算聚合度,获取疑似暗链的外链集;敏感关键字匹配。本发明采用基于代码聚合度的技术手段,识别网页中植入的暗链,并通过采用关键字校验技术,在识别准确度方面有了明显的提升。 | ||
搜索关键词: | 一种 基于 聚合 分析 检测 技术 | ||
【主权项】:
1.一种基于聚合度分析的暗链检测方法,用于检测网页中植入的暗链,所述暗链是指在源代码中聚合成水平或垂直的直线,且锚文本中包含有敏感关键字的外链;其特征在于,所述基于聚合度分析的暗链检测方法具体包括下述步骤:步骤一:向待检测的Web网站服务器发送HTTP请求,抓取待检测页面的响应HTML源代码;步骤二:对获得的响应HTML源代码建立链接坐标平面图;外部链接在链接坐标系中的坐标取值方式如下:1)外部链接在链接坐标系中的Y值:该外部链接在响应HTML源代码中的行数;2)外部链接在链接坐标系中的X值,每一行分别计算获得:首先将本行源代码中的每一个链接作为一个整体,然后以空格分隔每一个链接,将这一行源代码分割成一个数组,作为整体的链接不参与分割,各链接在分割产生的数组中的顺序即为该链接的X坐标值;通过上述定位,获得所有外部链接在链接坐标系中的坐标值,然后将各外部链接在链接坐标系中绘制出来,获得链接坐标平面图;步骤三:计算聚合度,获取疑似暗链的外链集:在链接坐标平面图中,计算所有外部链接的X值,是否存在连续N个点的X值相近;相近是指这N个点的连线近似于水平直线,即连线与Y轴的夹角值在88°到90°之间,则认为这连续的N个点对应的外部链接聚合符合条件;所述N是指大于0的自然数;同理,在链接坐标平面图中,计算外部链接的Y值是否满足聚合条件:是否存在连续N个点的Y值相近;相近是指这N个点的连线近似于垂直直线,即连线与X轴的夹角值在88°到90°之间,则认为这连续的N个点对应的外部链接聚合符合条件;所述N是指大于0的自然数;只要外部链接的X值或者Y值满足聚合条件,则认为这一批外部链接符合聚合,判定为疑似暗链的外链集;步骤四:敏感关键字匹配:使用暗链敏感关键字集合,对疑似暗链的外链集中的锚文本进行匹配,如果匹配次数超过二次,则判定该外链集是暗链;所述锚文本是指一个链接中的文本内容。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710846340.X/,转载请声明来源钻瓜专利网。