[发明专利]一种自动检测疑似仿冒网站的方法及系统无效
申请号: | 201310395429.0 | 申请日: | 2013-09-03 |
公开(公告)号: | CN103442014A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 云晓春;张永铮;周宇;肖军;王一鹏;李书豪 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动检测 疑似 仿冒 网站 方法 系统 | ||
技术领域
背景技术
仿冒网站,是网络在线欺骗活动的一种方式,主要用来窃取用户的私密信息,如信用卡账号密码、电子商务网站帐号密码等。仿冒网站的欺骗形式包括:
1.社交网络中利用社交群体散布仿冒网站信息;
2.即时通讯(IM)工具中利用在线交易或电子商务来引导用户进入不法仿冒网站;
3.邮件链接导入不法仿冒网站;
4.论坛或虚拟社区中张贴仿冒网站链接。
这些网站通常是对真实网站域名进行细微篡改,或其网页在视觉上与被仿冒网页具有高仿真度,进而骗取用户信任,获取用户信息,损害用户利益。
目前,业界通常有如下共识:
仿冒网站:指网站地址的名称或网页在视觉上非常类似于正规的商业网站,且意图在于损害用户利益的网站。
白名单:指待保护的正规网站列表,一般来说这类需要保护的网站地址,是网络交易或者电子商务中高频度出现的网站,比如淘宝、Ebay、京东等电子商务网站,工商银行、中国银行等银行交易系统,“中国好声音”、“中国最强音”等大众娱乐网页,这些都是仿冒者攻击的目标。
黑名单:指已验证的仿冒网站列表,这类列表中的网站都是通过用户投诉、网上举报或者人工筛查获得,并经过相关管理部门确认的仿冒网站,这类列表中的网站通常已经对用户利益造成了损害。
现有的仿冒网站检测识别技术通常都是基于黑名单和白名单机制。给定待检测网站地址,通过查询白名单或者黑名单来判断所述待检测网站地址是否在名单之列,来识别正规网站或仿冒网站。但是,现有的黑白名单检测识别技术仅仅可以识别出黑名单中已有的仿冒网站,如果某仿冒网站不在黑名单内,则无法识别。然而,网络的变化性很大,不法分子可以通过重新申请新的网站地址的方式继续行骗,而现有的识别技术需要在收到举报或者事发后才能更新黑名单的数据库,无法做到事前检测识别,风险警示。
发明内容
本发明所要解决的技术问题是,针对现有技术无法事先识别仿冒网站的现状,提供一种达到事前识别,降低访问仿冒网站概率的目的的自动检测疑似仿冒网站的方法。
本发明解决上述技术问题的技术方案如下:一种自动检测疑似仿冒网站的方法,具体包括以下步骤:
步骤1:接收到多个网站地址,并将多个网站地址排列成网站地址列表;
步骤2:按照列表顺序将网站地址列表中的一个网站地址与预设的白名单相匹配,判断是否匹配,如果匹配,允许用户访问该网站地址并对该网站地址添加白名单标记,跳转至步骤6;否则,继续步骤3;
步骤3:将当前网站地址与预设的黑名单相匹配,判断是否匹配,如果匹配,则禁止用户访问该网站地址并对该网站地址添加黑名单标记,跳转至步骤6;否则,继续步骤4;
步骤4:将当前网站地址对应的网页内容与所有白名单网站中内设的专属标识LOGO图片进行匹配,并计算相似度,得到最大相似度值;
步骤5:判断最大相似度值是否大于预设的阈值,如果是,则判定当前网站地址为疑似仿冒网站并对该网站地址添加疑似仿冒标记;否则,判定当前网站地址为非疑似仿冒网站添加非疑似仿冒标记;
步骤6:判断网站地址列表中是否存在未添加标记的网站地址,如果有,进行步骤2;否则,结束。
本发明的有益效果是:本发明所述一种自动检测疑似仿冒网站的方法,可以在用户个人利益受到侵害之前检测出疑似仿冒网站,降低用户损失。与已公开的相关技术相比,本发明采用基于局部特征点的目标网站LOGO图片与待检测网站整体图片的匹配方法,在保证能够检测出视觉相似的仿冒网站的前提下,有效检测出与仿冒目标网站有视觉差异的仿冒网站。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤4具体包括以下步骤:
步骤4.1:获取所有白名单网站的专属标识LOGO图片;
步骤4.2:采集当前网站地址的URL统一资源定位符,并通过网络下载得到当前网站地址对应的网页整体图像;
步骤4.3:将当前网站地址对应的网页整体图像与所有白名单网站的专属标识LOGO图片依次进行对比,并计算相似度得到多个相似度值;
步骤4.4:将多个相似度值按从大到小进行排序,得到最大相似度值。
进一步,所述步骤4.3具体包括以下步骤:
步骤4.3.1:对当前网站地址对应的网页整体图像提取特征点,构成待测特征点集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310395429.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防起拱不见缩缝的导热地板
- 下一篇:开关防尘限位装置