[发明专利]一种钓鱼网站查找系统及方法有效

专利信息
申请号: 201210220826.X 申请日: 2012-06-28
公开(公告)号: CN102799814A 公开(公告)日: 2012-11-28
发明(设计)人: 陈营营 申请(专利权)人: 北京奇虎科技有限公司;奇智软件(北京)有限公司
主分类号: G06F21/00 分类号: G06F21/00;G06F17/30;H04L29/06
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹
地址: 北京市西城区新街口外*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 钓鱼 网站 查找 系统 方法
【说明书】:

技术领域

发明涉及网络安全技术领域,特别涉及一种钓鱼网站查找系统及方法。

背景技术

随着互联网的发展,网民数量逐年增加。在上网时,除了传统的木马、病毒的威胁,近两年钓鱼网站的数量大幅增加。互联网上每天新产生十多万的站点,数十亿的新URL,数量庞大。因此,除了能准确识别钓鱼网站外,钓鱼网站的发现速度也显得越来越重要。许多互联网公司都在致力于解决这样一个难题:如何在钓鱼网站未大量传播之前,甚至在未开始传播前发现它。

现有的钓鱼网站发现技术多采用以下两种方法:通过特定关键词对搜索引擎结果页进行监控;通过与客户端结合,对网民访问较少的网址进行监控识别。

无论是通过特定关键词对搜索引擎结果页进行监控,还是通过与客户端结合,对网民访问较少的网址进行监控,都具有滞后情。特别是第二种方法,更是需要有网民访问以后,才有可能发现这些网址,而这过程中,最先访问这个钓鱼网站的网民可能已经上当受骗。

发明内容

本发明要解决的技术问题是:然后他提供一种钓鱼网站查找系统及方法,以提高钓鱼网站的查找速度。

为解决上述技术问题,本发明提供一种钓鱼网站查找系统,其包括:

种子库建立单元,适于将命中已知钓鱼网站的个数大于预定阈值的目标网页的原始链接作为种子链接放入种子库;

种子提取器,适于提取出所述种子库中的种子链接;

种子网页分析器,适于根据所述提取出的种子链接查找对应的种子网页,对所述种子网页进行分析,得到所述种子网页中存在的可疑链接;

判断单元,适于查找所述可疑链接对应的可疑网页,判断所述可疑网页是否是钓鱼网站;

输出接口,适于在所述可疑网页是钓鱼网站时,输出相应的钓鱼网站。

其中,所述系统还包括:网页抓取器;

所述网页抓取器,适于抓取所述目标网页。

其中,所述种子库建立单元包括:

黑名单模块,适于根据已知钓鱼网站建立黑名单库;

选择模块,适于在所述目标网页命中所述黑名单库中已知钓鱼网站的个数大于预定阈值时,将所述目标网页的原始链接作为种子链接放入种子库。

其中,所述输出接口还适于在输出相应的钓鱼网站后更新所述黑名单库。

其中,所述目标网页命中所述黑名单库中已知钓鱼网站的个数的计算公式如下:

N=|M|;

M=W∩D;

其中,W表示所述目标网页中所包含的链接的集合;D表示所述黑名单库中已知钓鱼网站的域名的集合;M表示W和D的交集;|M|表示M中元素的数量;N表示所述目标网页命中所述黑名单库中已知钓鱼网站的个数。

本发明还提供一种钓鱼网站查找方法,其包括步骤:

A:将命中已知钓鱼网站的个数大于预定阈值的目标网页的原始链接作为种子链接放入种子库;

B:提取出所述种子库中的种子链接,收集所述种子链接对应的种子网页中出现的可疑链接;

C:当所述可疑链接对应的可疑网页是钓鱼网站时,输出相应的钓鱼网站。

其中,所述将命中已知钓鱼网站的个数大于预定阈值的目标网页的原始链接作为种子链接放入种子库的步骤,进一步包括:

A2:抓取目标网页,判断所述目标网页命中已知钓鱼网站的个数是否大于预定阈值,如果是,将所述目标网页的原始链接作为种子链接放入种子库,然后执行步骤A3;否则,直接执行步骤A3;

A3:判断所述种子库中的种子链接的数量是否大于预定种子数,如果是,执行步骤B;否则,返回步骤A2。

其中,在所述步骤A2之前还包括步骤A1:根据已知钓鱼网站建立黑名单库;

并且,在所述步骤A2中,判断所述目标网页命中已知钓鱼网站的个数是否大于预定阈值的步骤进一步为,判断所述目标网页命中所述黑名单库中已知钓鱼网站的个数是否大于预定阈值。

其中,所述目标网页命中所述黑名单库中已知钓鱼网站的个数的计算公式如下:

N=|M|;

M=W∩D;

其中,W表示所述目标网页中所包含的链接的集合;D表示所述黑名单库中已知钓鱼网站的域名的集合;M表示W和D的交集;|M|表示M中元素的数量;N表示所述目标网页命中所述黑名单库中已知钓鱼网站的个数。

其中,所述当所述可疑链接对应的可疑网页是钓鱼网站时输出相应的钓鱼网站,进一步包括步骤:

C1:判断所述可疑网页是否是钓鱼网站,如果是,输出相应的钓鱼网站,更新所述黑名单库,然后执行步骤C2;否则,直接执行步骤C2;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210220826.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top