[发明专利]一种识别网站页面的方法和装置有效

专利信息
申请号: 201210277999.5 申请日: 2012-08-06
公开(公告)号: CN102833233A 公开(公告)日: 2012-12-19
发明(设计)人: 李晓波;刘起 申请(专利权)人: 北京奇虎科技有限公司;奇智软件(北京)有限公司
主分类号: H04L29/06 分类号: H04L29/06;G06F21/00
代理公司: 北京市中伦律师事务所 11410 代理人: 程义贵;王桂玲
地址: 100088 北京市西城区新*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 网站 页面 方法 装置
【权利要求书】:

1.一种用于识别钓鱼网站页面的方法(100),包括:

收集潜在钓鱼网站页面的网址并且对于潜在钓鱼网站页面进行分析(S101);

根据分析结果和预先定义的反钓鱼数据库,调整所述潜在钓鱼网站页面在静态抓取队列中的排序(S103);

按照排序对所述静态抓取队列中的所述潜在钓鱼网站页面进行静态抓取(S105);

将静态抓取失败的潜在钓鱼网站页面提交至动态抓取队列并进行动态抓取(S107);以及

基于所述预先定义的反钓鱼数据库,根据静态抓取和动态抓取获得的数据识别钓鱼网站页面(S109)。

2.如权利要求1所述的方法,其中所述预先定义的反钓鱼数据库包括钓鱼网站页面的特征信息以及用于确定是否动态抓取潜在钓鱼网站页面的分类信息,所述钓鱼网站页面的特征信息包括IP数据、域名、注册信息、内嵌链接、META标签信息、标题信息、关键词、文档对象模型DOM结构。

3.如权利要求2所述的方法,还包括:在所述收集潜在钓鱼网站页面的网址并且对于潜在钓鱼网站页面进行分析(S101)的步骤之后,在所述根据分析结果和预先定义的反钓鱼数据库调整所述潜在钓鱼网站页面在静态抓取队列中的排序(S103)的步骤之前,

根据分析结果和预先定义的反钓鱼数据库,将符合所述预先定义的反钓鱼数据库中的所述分类信息的潜在钓鱼网站页面提交至动态抓取队列(S102)。

4.如权利要求2所述的方法,其中所述分析结果包括潜在钓鱼网站页面的页面浏览量PV数据、独立访客量UV数据、以及所述特征信息和所述分类信息。

5.如权利要求1至4中的任一项所述的方法,还包括:

提取所识别出的钓鱼网站页面的特征信息以及分类信息(S110);以及

将所述特征信息以及分类信息添加到所述预先定义的反钓鱼数据库(S111)。

6.如权利要求1至4中的任一项所述的方法,其中所述根据分析结果和预先定义的反钓鱼数据库调整所述潜在钓鱼网站页面在静态抓取队列中的排序(S103)的步骤包括:将具有以下特征的潜在钓鱼网站页面在静态抓取队列中的排序提前:

(1)在预先定义的时间点后收集到其信息的潜在钓鱼网站页面;和/或

(2)页面浏览量PV数据和/或独立访客量UV数据大于预先定义的第一阈值的潜在钓鱼网站页面;和/或

(3)与所述预先定义的反钓鱼数据库中的钓鱼网站页面的特征信息匹配程度大于预先定义的第二阈值的潜在钓鱼网站页面。

7.如权利要求1至4中的任一项所述的方法,其中所述基于所述预先定义的反钓鱼数据库、根据静态抓取和动态抓取获得的数据识别钓鱼网站页面(S109)的步骤包括:

将静态抓取和动态抓取获得的数据中的潜在钓鱼网站页面的特征信息与所述预先定义的反钓鱼数据库中的特征信息进行比较(S109a);以及

根据比较结果识别钓鱼网站页面(S109b)。

8.如权利要求7所述的方法,其中所述根据比较结果识别钓鱼网站页面(S109b)的步骤包括:

根据比较结果中潜在钓鱼网站页面的特征信息与所述预先定义的反钓鱼数据库中的特征信息的匹配情况,确定所述潜在钓鱼网站页面的类别(S109b1);以及

在比较结果中潜在钓鱼网站页面的特征信息与所述预先定义的反钓鱼数据库中所述类别的特征信息的匹配程度大于用于所述类别的阈值的情况下,将所述潜在钓鱼网站页面识别为钓鱼网站页面(S109b2)。

9.如权利要求1至4中的任一项所述的方法,其中所述静态抓取队列存储用于静态抓取的潜在钓鱼网站页面,所述动态抓取队列存储用于动态抓取的潜在钓鱼网站页面。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210277999.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top