[发明专利]一种自动检测疑似仿冒网站的方法及系统无效
申请号: | 201310395429.0 | 申请日: | 2013-09-03 |
公开(公告)号: | CN103442014A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 云晓春;张永铮;周宇;肖军;王一鹏;李书豪 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动检测 疑似 仿冒 网站 方法 系统 | ||
1.一种自动检测疑似仿冒网站的方法,其特征在于,具体包括以下步骤:
步骤1:接收到多个网站地址,并将多个网站地址排列成网站地址列表;
步骤2:按照列表顺序将网站地址列表中的一个网站地址与预设的白名单相匹配,判断是否匹配,如果匹配,允许用户访问该网站地址并对该网站地址添加白名单标记,跳转至步骤6;否则,继续步骤3;
步骤3:将当前网站地址与预设的黑名单相匹配,判断是否匹配,如果匹配,则禁止用户访问该网站地址并对该网站地址添加黑名单标记,跳转至步骤6;否则,继续步骤4;
步骤4:将当前网站地址对应的网页内容与所有白名单网站中内设的专属标识LOGO图片进行匹配,并计算相似度,得到最大相似度值;
步骤5:判断最大相似度值是否大于预设的阈值,如果是,则判定当前网站地址为疑似仿冒网站并对该网站地址添加疑似仿冒标记;否则,判定当前网站地址为非疑似仿冒网站添加非疑似仿冒标记;
步骤6:判断网站地址列表中是否存在未添加标记的网站地址,如果有,进行步骤2;否则,结束。
2.根据权利要求1所述的一种自动检测疑似仿冒网站的方法,其特征在于,所述步骤4具体包括以下步骤:
步骤4.1:获取所有白名单网站的专属标识LOGO图片;
步骤4.2:采集当前网站地址的URL统一资源定位符,并通过网络下载得到当前网站地址对应的网页整体图像;
步骤4.3:将当前网站地址对应的网页整体图像与所有白名单网站的专属标识LOGO图片依次进行对比,并计算相似度得到多个相似度值;
步骤4.4:将多个相似度值按从大到小进行排序,得到最大相似度值。
3.根据权利要求2所述的一种自动检测疑似仿冒网站的方法,其特征在于,所述步骤4.3具体包括以下步骤:
步骤4.3.1:对当前网站地址对应的网页整体图像提取特征点,构成待测特征点集;
步骤4.3.2:对所有白名单网站的专属标识LOGO图片分别提取特征点,分别构成多个对应的白名单特征点集;
步骤4.3.3:对待测特征点集计算SURF(Speeded Up Robust Features)待测局部特征描述子;对多个白名单特征点集分别计算SURF(Speeded Up Robust Features)白名单局部特征描述子;
步骤4.3.4:利用近邻检测快速工具包(FLANN,Fast Library for Approximate Nearest Neighbors)对待测局部特征描述子与多个白名单局部特征描述子间的快速匹配;
步骤4.3.5:将多个匹配结果换算为数值,得到多个相似度值。
4.根据权利要求1至3任一项所述的一种自动检测疑似仿冒网站的系统,其特征在于,所述步骤5中的阈值获取包括以下步骤:
步骤a:根据国家互联网权威管理部门提供的黑名单中仿冒网站(URL)统一资源定位符的集合,利用网络下载获得黑名单对应的整体图像,得到黑名单图像合集;
步骤b:将白名单中的一个白名单网站的专属标识LOGO图片依次与黑名单图像集合中的图像进行相似度计算,得到多个相似度值;
步骤c:对多个相似度值取平均值得到相似度均值;
步骤d:判断是否白名单中所有的白名单网站都已进行相似度计算,如果是,进行步骤e;否则,跳转至步骤b;
步骤e:将所有白名单网站计算得到的相似度均值按数值大小排序,得到最小相似度均值为阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310395429.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防起拱不见缩缝的导热地板
- 下一篇:开关防尘限位装置