[发明专利]基于图片匹配检测钓鱼网页的方法及装置有效
申请号: | 201410392300.9 | 申请日: | 2014-08-11 |
公开(公告)号: | CN104143008B | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 李晓波;尹露;杨晶;郭峰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙)11276 | 代理人: | 宋菲,刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 匹配 检测 钓鱼 网页 方法 装置 | ||
1.一种基于图片匹配检测钓鱼网页的方法,所述方法的执行基于预先建立的包含多个第一图片和第二图片的图片规则库,在建立图片规则库时对第二图片进行分类,得到对应类别的图片规则库,所述第一图片是已知钓鱼网页的截图,所述第二图片是在所述第一图片中所截取的具有钓鱼网页特征的图片,其中,第二图片的尺寸小于或等于第一图片的尺寸;
所述方法包括:
对浏览器打开的网页进行截图,获取第三图片;
计算所述第三图片与所述图片规则库中所有第一图片的相似度;
根据相似度对图片规则库中的所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一图片的数量小于所述图片规则库中第一图片的总数量;
将所述第三图片与选取的第一图片对应的第二图片进行匹配,若选取的第一图片对应的第二图片中的至少一个与所述第三图片匹配,则确定所述网页为可疑的钓鱼网页。
2.根据权利要求1所述的方法,所述计算所述第三图片与所述图片规则库中所有第一图片的相似度进一步包括:
分别对所述第三图片和所述图片规则库中的所有第一图片进行聚类处理,获取聚类处理后第三图片和图片规则库中第一图片的特征点;
根据聚类处理后第三图片和图片规则库中第一图片的特征点计算特征点相似度。
3.根据权利要求1或2所述的方法,所述根据相似度对图片规则库中的所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一图片的数量小于所述图片规则库中第一图片的总数量进一步包括:
根据相似度由高至低的顺序对图片规则库中的第一图片进行排序,选取相似度大于第一预定值的多个第一图片。
4.根据权利要求1或2所述的方法,所述根据相似度对图片规则库中的所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一图片的数量小于所述图片规则库中第一图片的总数量进一步包括:
根据相似度由高至低的顺序对图片规则库中的第一图片进行排序,选取数量为第二预定值的多个第一图片。
5.根据权利要求2所述的方法,在所述分别对第三图片和所述图片规则库中的所有第一图片进行聚类处理之前还包括:对所述图片规则库中的所有第一图片的特征点进行消重处理。
6.根据权利要求1或2或5所述的方法,其中,所述对浏览器打开的网页进行截图,获取第三图片进一步包括:
通过服务器接收用户访问的网页的统一资源定位符;
调用chrome浏览器打开所述统一资源定位符对应的网页;
执行截图命令,对所述统一资源定位符对应的网页进行截图,获取第三图片。
7.根据权利要求1或2或5所述的方法,其中,所述对浏览器打开的网页进行截图,获取第三图片进一步包括:
远程调用IE机器接收用户访问的网页的MHT文件的地址;
通过将MHT文件的地址嵌入到IE浏览器,打开MHT文件对应的网页;
执行截图命令,对所述MHT文件对应的网页进行截图,获取第三图片。
8.根据权利要求1或2或5所述的方法,将所述第三图片与选取的第一图片对应的第二图片进行匹配进一步包括:
分别抽取所述第三图片与选取的第一图片对应的第二图片的特征;
将所述第三图片的特征与选取的第一图片对应的第二图片的特征进行匹配,若所述第三图片的特征与选取的第一图片对应的第二图片中的任一第二图片的特征匹配,则确定所述网页为可疑的钓鱼网页。
9.根据权利要求8所述的方法,其中,所述将所述第三图片的特征与选取的第一图片对应的第二图片的特征进行匹配进一步包括:
查找所述第三图片的特征与选取的第一图片对应的第二图片的特征匹配的邻近特征点,若所述邻近特征点个数大于第一阈值,则确定所述网页为可疑的钓鱼网页。
10.根据权利要求1或2或5所述的方法,其中,所述图片规则库的建立包括:
对多个已知钓鱼网页进行截图,获取第一图片,从每个第一图片中截取具有钓鱼网页特征的至少一个第二图片,并将所述第二图片添加到图片规则库中,其中,第二图片的尺寸小于或等于所述第一图片的尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410392300.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空间辐射环境环境危害识别的方法
- 下一篇:一种相关搜索系统及方法