[发明专利]通过图片匹配来检测钓鱼网页的方法及装置在审
申请号: | 201410240956.9 | 申请日: | 2014-05-30 |
公开(公告)号: | CN103986731A | 公开(公告)日: | 2014-08-13 |
发明(设计)人: | 李晓波;牛成;尹露;杨晶;郭峰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 图片 匹配 检测 钓鱼 网页 方法 装置 | ||
1.一种通过图片匹配来检测钓鱼网页的方法,所述方法的执行基于预先建立的包含多个第一图片的图片规则库,所述第一图片是在已知钓鱼网页的截图中所截取的具有钓鱼网页特征的图片;
所述方法包括:
对浏览器打开的网页进行截图,获取第二图片;
将第二图片与所述图片规则库所包含的多个第一图片进行匹配,若所述图片规则库内存在与所述第二图片匹配的第一图片,则确定所述网页为可疑的钓鱼网页。
2.根据权利要求1所述的方法,其中,所述对用户访问的网页进行截图,获取第二图片进一步包括:
通过服务器接收用户访问的网页的统一资源定位符;
调用chrome浏览器打开所述统一资源定位符对应的网页;
执行截图命令,对所述统一资源定位符对应的网页进行截图,获取第二图片。
3.根据权利要求1所述的方法,其中,所述对用户访问的网页进行截图,获取第二图片进一步包括:
远程调用IE机器接收用户访问的网页的MHT文件的地址;
通过将MHT文件的地址嵌入到IE浏览器,打开MHT文件对应的网页;
执行截图命令,对所述MHT文件对应的网页进行截图,获取第二图片。
4.根据权利要求1-3任一项所述的方法,其中,所述将第二图片与所述图片规则库所包含的多个第一图片进行匹配进一步包括:
分别抽取所述第二图片与所述图片规则库所包含的多个第一图片的特征;
将所述第二图片的特征与所述图片规则库所包含的多个第一图片的特征进行匹配,若所述第二图片的特征与所述图片规则库所包含的任一第一图片的特征匹配,则确定所述网页为可疑的钓鱼网页。
5.根据权利要求4所述的方法,其中,所述将所述第二图片的特征与所述图片规则库所包含的多个第一图片的特征进行匹配进一步包括:
查找所述第二图片的特征与所述图片规则库所包含的多个第一图片的特征匹配的邻近特征点,若所述邻近特征点个数大于第一阈值,则确定所述网页为可疑的钓鱼网页。
6.根据权利要求1-5任一项所述的方法,其中,所述图片规则库的建立包括:
对多个已知钓鱼网页进行截图,从每个已知钓鱼网页的截图中截取具有钓鱼网页特征的至少一个第一图片,并将所述第一图片添加到图片规则库中,其中,第一图片的尺寸小于或等于所述已知钓鱼网页的截图的尺寸。
7.根据权利要求1-5任一项所述的方法,其中,所述图片规则库的建立包括:
对初始获取的多个已知钓鱼网页进行截图,从每个已知钓鱼网页的截图中截取具有钓鱼网页特征的至少一个第一图片,并将所述第一图片添加到图片规则库中作为样本集;
对所述样本集包含的第一图片进行分类,对分类后的样本集进行分类学习得到各个类别对应的图片特征库;
对后续获取的已知钓鱼网页进行截图,从已知钓鱼网页的截图中截取具有钓鱼网页特征的至少一个第三图片,提取该第三图片的特征;
将所述第三图片的特征与所述各个类别对应的图片特征库进行匹配,若所述第三图片的特征与一类别对应的图片特征库匹配,则将所述第三图片作为第一图片添加到图片规则库中,并将所述第三图片归类与所匹配的类别。
8.根据权利要求1-7任一项所述的方法,在所述确定网页为可疑的钓鱼网页之后还包括:
采用基于URL和/或IP和/或网页内容进行识别的方法对所述网页进行识别,确定所述网页是否为钓鱼网页。
9.一种通过图片匹配来检测钓鱼网页的装置,其包括:
图片规则库,所述图片规则库包含多个第一图片,所述第一图片是在已知钓鱼网页的截图中所截取的具有钓鱼网页特征的图片;
获取模块,适于对浏览器打开的网页进行截图,获取第二图片;
匹配模块,适于将第二图片与所述图片规则库所包含的多个第一图片进行匹配,若所述图片规则库内存在与所述第二图片匹配的第一图片,则确定所述网页为可疑的钓鱼网页。
10.根据权利要求9所述的装置,其中,所述获取模块进一步包括:
接收单元,适于通过服务器接收用户访问的网页的统一资源定位符;
调用单元,适于调用chrome浏览器打开所述统一资源定位符对应的网页;
获取单元,适于执行截图命令,对所述统一资源定位符对应的网页进行截图,获取第二图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410240956.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:煤液化油中酚类化合物的分离方法
- 下一篇:一种振弦式传感器激振方法