[发明专利]基于网络群挖掘的钓鱼网站检测方法无效
申请号: | 201310000811.7 | 申请日: | 2013-01-05 |
公开(公告)号: | CN102999638A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 张卫丰;滕雯静;张迎周;周国强;王子元;周国富;钱小燕;许碧欢;陆柳敏 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 挖掘 钓鱼 网站 检测 方法 | ||
1.一种基于网络群挖掘的钓鱼网站检测方法,其特征在于该检测方法所包含的步骤为:
步骤1) 获取可疑网页的潜在目标网站:
步骤1.1)输入可疑网页;
步骤1.2)获取可疑网页所在的网站;
步骤1.3)获取可疑网页的相关网页群:
步骤1.3.1)输入可疑网页中的所有链接;
步骤1.3.2)生成种子网页集;
步骤1.3.3)初始化迭代次数为0;
步骤1.3.4)生成有向图,迭代次数加1:
步骤1.3.4.1)根据种子网页集,生成初始有向图;
步骤1.3.4.2)获取种子网页集中所有网页的后向链接网页;
步骤1.3.4.3)把步骤1.3.4.2)中找到的新网页加入有向图,更新有向图;
步骤1.3.4.4)获取新网页的前向链接网页;
步骤1.3.4.5)把步骤1.3.4.4)中找到的新网页加入有向图,更新有向图;
步骤1.3.5)判断有向图中是否包含可疑网页,如果包含,转步骤4.1),否则,转步骤1.3.6);
步骤1.3.6)用最大流最小切算法切割有向图;
步骤1.3.7)获取可疑网页的相关网页群;
步骤1.3.8)判断迭代次数是否小于N次,N是设定的常数,如果不小于,转步骤1.3.9),否则,转步骤1.4);
步骤1.3.9)更新种子网页集:
步骤1.3.9.1)将属于相关网页群,但是不属于种子网页集,且到它的出度或入度最高的网页加入集合种子网页集;
步骤1.3.9.2)将属于种子网页集,但是不属于相关网页群,且到它的出度与入度之和小于m的网页从种子网页集中去除;
步骤1.3.10)判断种子网页集是否有改变,如果有改变,则转步骤1.3.4),否则,转步骤1.4);
步骤1.4)获取可疑网页的潜在目标网页群:
步骤1.4.1)获取相关网页群的邻接矩阵;
步骤1.4.2)计算邻接矩阵的转置与邻接矩阵的乘积矩阵;
步骤1.4.3)计算邻接矩阵与其转置矩阵的乘积矩阵;
步骤1.4.4)计算乘积矩阵的特征值;
步骤1.4.5)计算乘积矩阵的特征向量;
步骤1.4.6)归一化特征值、特征向量;
步骤1.4.7)获取归一化绝对值最大的元素;
步骤1.4.8)计算邻接矩阵与其转置矩阵的乘积矩阵;
步骤1.5)获取潜在目标网页群;
步骤2)获取网站的网站特征签名:
步骤2.1)将网站内的网页以图片的形式保存下来;
步骤2.2)提取网页全局特征,内容形式是六维向量:<网页标题,网页文件的大小,网页中包含的图片个数,网页全局图片的面积,网页全局图片的颜色直方图,网页全局图片的二维哈尔小波变换>;
步骤2.3)计算网页的感知哈希特征,内容形式是三维向量:<离散余弦变换,马尔算子,径向方差>;
步骤2.4)获取网站的网站特征签名;
步骤3)网站特征签名的相似性计算:
步骤3.1)输入两个网站的特征签名;
步骤3.2)获取两个签名的第一对节点;
步骤3.3)利用节点间相似性计算方法计算两节点之间的相似度;
步骤3.4)判断相似度是否大于0,如果不大于,转步骤3.7),否则,转步骤3.5);
步骤3.5)在节点之间添加一条权值为相似度的边;
步骤3.6)判断签名的节点是否遍历全部遍历,如果全部遍历,转步骤3.8),否则,转步骤3.7);
步骤3.7)获取特征签名的下一对节点;
步骤3.8)获取网站特征签名的二分图;
步骤3.9)判断两个网站的特征签名的长度是否相等,如果相等,则转步骤3.11),否则,转步骤3.10);
步骤3.10)获取二分图的扩展二分完全图;
步骤3.11)利用二分图的最佳匹配算法获取二分图的最佳匹配;
步骤3.12)计算二分图最佳匹配中的边的加权平均值;
步骤3.13)获取网站签名的相似度;
步骤4)输出钓鱼检测的结果:
步骤4.1)判断相似度是否大于阈值,如果大于,则可疑网站为钓鱼网站,并输出其目标网站,否则,输出:“可疑网站是合法网站”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310000811.7/1.html,转载请声明来源钻瓜专利网。