[发明专利]一种基于页面视觉相似性的仿冒网站检测方法和系统有效
申请号: | 201510434950.X | 申请日: | 2015-07-22 |
公开(公告)号: | CN105119909B | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 高胜;胡俊;何世平;徐原;赵慧;徐晓燕;刘婧;陈阳;李世淙;党向磊;饶毓;赵宸 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06T7/00 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 页面 视觉 相似性 仿冒 网站 检测 方法 系统 | ||
本发明涉及一种基于页面视觉相似性的仿冒网站检测方法和系统,包括,获取待检测网站地址列表;逐一将该列表中的网站地址与预设白名单相匹配,若匹配则允许用户访问该网站地址并对其添加白名单标记;否则将当前网站地址与预设黑名单相匹配,若匹配禁止用户访问该网站地址并对其添加黑名单标记;若当前网站地址不在预设白名单和黑名单内,则根据待检测网站地址列表对应的网页内容与预设白名单进行相似度度量,获取最大相似度值,并与预设阈值T比较;判断待检测网站地址列表中是否存在未添加标记的网站地址,若存在则重新检测,否则结束。利用该方法完成仿冒网站检测一定程度上缩减了用户访问仿冒网站的概率,降低了误入虚假网站带来的损失。
技术领域
本发明涉及一种检测方法和系统,具体涉及一种基于网页页面视觉相似性的仿冒网站检测方法和系统。
背景技术
仿冒网站,是通过仿冒网页进行在线欺骗活动的一种攻击方式,主要用来窃取用户的隐私信息,如邮箱帐号密码、信用卡账号密码和电子商务网站帐号密码等。仿冒网站的欺骗形式主要包括:
1.邮件链接扩散;
2.网页论坛回复中张贴;
3.社交网络中利用社交群体散布仿冒网站信息;
4.即时通讯(IM)工具中利用在线交易或电子商务来引导用户进入不法仿冒网站。
这些网站通常是对被仿冒网站域名进行细微篡改,或其网页在视觉上与被仿冒网页具有高仿真度,进而骗取用户信任,获取用户信息,损害用户利益。
目前,业界通常有如下共识:
仿冒网站:指网站地址的名称或网页的页面内容在视觉上非常类似于正规的商业网站,且意图在于损害用户经济或其他利益的网站。
白名单:指待保护的正规网站和经权威机构认证为正规网站的网站列表,一般来说需要保护的网站地址,是网络交易或者电子商务中高频度出现的网站,比如淘宝、Ebay、京东等电子商务网站,工商银行、中国银行等银行交易系统,“中国好声音”、“中国最强音”等大众娱乐网页,这些都是仿冒者攻击的目标。
黑名单:指已由相关机构验证的仿冒网站列表,这类列表中的网站都是通过用户投诉、网上举报、人工筛查或其他方式获得,并经过相关管理部门确认的仿冒网站。
现有的仿冒网站检测识别技术多是基于黑名单和白名单机制。给定待检测网站地址,通过查询白名单或者黑名单来判断所述待检测网站地址是否在名单之列,来识别正规网站或仿冒网站。但是,现有的黑白名单检测识别技术仅仅可以识别出黑名单中已有的仿冒网站,如果某仿冒网站不在黑名单内,则无法识别。然而,网络的变化性很大,不法分子可以通过重新申请新的网站地址的方式继续行骗,而现有的识别技术需要在收到举报或者事发后才能更新黑名单的数据库,无法做到事前检测识别,风险警示。
发明内容
针对现有技术的不足,本发明提供一种基于页面视觉相似性的仿冒网站检测方法和系统,该方法可以检测零时钓鱼网站,有效降低网络用户的损失。
本发明的目的是采用下述技术方案实现的:
一种基于页面视觉相似性的仿冒网站检测方法,所述方法包括:
(1)搜索待检测网站,获取待检测网站地址列表;
(2)逐一将待检测网站地址列表中的网站地址与预设白名单相匹配,判断是否匹配,如果匹配,允许用户访问该网站地址并对该网站地址添加白名单标记,跳转至步骤(6);否则,继续步骤(3);
(3)将当前网站地址与预设黑名单相匹配,判断是否匹配,如果匹配,禁止用户访问该网站地址并对该网站地址添加黑名单标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510434950.X/2.html,转载请声明来源钻瓜专利网。