[发明专利]一种基于最近邻及相似度测量检测钓鱼网页的方法无效
申请号: | 201110112442.1 | 申请日: | 2011-04-29 |
公开(公告)号: | CN102170447A | 公开(公告)日: | 2011-08-31 |
发明(设计)人: | 张卫丰;李涛贤;周国强;张迎周;许碧欢;陆柳敏 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26;G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 近邻 相似 测量 检测 钓鱼 网页 方法 | ||
技术领域
本发明涉及一种钓鱼网页检测的方法,主要从网页整体视觉特性来提取特征值并进行相应的特征值距离计算从而对钓鱼网页进行匹配和识别,属于信息安全领域。
背景技术
钓鱼网站是随着网络普及和在线交易增加而变得异常猖獗的网络诈骗行为。钓鱼网站是犯罪分子做出的诈骗网站,钓鱼网站通常与银行网站或其他知名网站几乎完全相同,从而引诱网站使用者在钓鱼网站上提交出敏感信息(如:用户名、口令、银行帐号或信用卡详细信息等)[Zhang2007]。
图1是钓鱼网站的体系结构。最典型的网络钓鱼攻击过程如下:首先将用户引诱到一个通过精心设计与目标组织的网站非常相似的钓鱼网站上,然后获取用户在该钓鱼网站上输入的个人敏感信息,例如银行帐号、银行密码等。通常这个攻击过程不会让受害者警觉。这些个人信息对钓鱼网站持有者具有非常大的吸引力,通过使用窃取到的个人信息,他们可以假冒受害者进行欺诈性金融交易,获得极大的经济利益,而受害者们却因此而遭受到巨大的经济损失,非但如此,被窃取的个人信息还可能被用于其他非法活动。如何识别钓鱼网站,如何保证网站信息传输的保密完整性,愈发的显示出其重要性和必要性。
当前钓鱼网站识别主要靠计算机自动识别和人工识别两种方式,人工识别采用黑名单机制,用户对某个网站进行举报,通过人工鉴定是否为钓鱼网站,这样显然速度太慢。计算机自动识别目前主要是基于页面视觉相似性检测方式判断是否为钓鱼网站,电脑通过抽取网页的视觉、文字特征与大多数主要的合法网站页面进行相似度对比或进行机器学习,从而判断是否为钓鱼网站。
大多数用户会受骗,很多时候是由于钓鱼网页总是与真实网页有高度的相似性。由于人们一般都比较注重自己浏览网页的主要目的,进而忽视了安全性问题的提示,并且视觉欺骗率很高。由此人们想到从视觉角度来检测,基于视觉的检测分为基于HMTL文本的检测、基于布局的检测和基于图像[Chen2009]的检测。基于超文本链接标示语言文本的检测方法很多,如现有web文档识别方法的评估,叠瓦法,用单词序列来检测两个文档中的差异,以及随机投影算法,用单词的随机投影作为相似性检测的一个签名。但是由于超文本链接标示语言语言的灵活性和网页元素的动态性及丰富性,仿冒者可以轻易地做出视觉上一样但是超文本链接标示语言结构不同的网页,这样,基于超文本链接标示语言的匹配将会失效。基于布局特征和图像特征的网页相似检测方法根据人的视觉原理,对网页的相似性进行计算,是一种通用的检测方法,如2006年Fu等人提出了一种基于像素的EMD距离的匹配算法[Fu2006],这种算法是在像素水平上从视觉的相似性角度来察觉钓鱼网页的。从实验结果可以看出:效果要明显好于基于超文本链接标示语言内容的检测,但也有其局限性,该算法只考虑了网页图像中的颜色及其分布特点,没有考虑网页中不同部分之间的位置关系。根据格斯塔视觉原理,相对位置在人的视觉中占主要地位,特别是多个形体间的相对位置关系,相对位置关系的变化必然导致视觉上的区别,而该算法由于没有考虑相对位置因素可能导致相似检测的失效,所以这种方法只能检测出与真实网页在视觉上有相似性的网页。
钓鱼者为了取得用户的信任,通常会模仿合法网站来构建钓鱼网站,所以一个钓鱼网站跟它的目标网站是有很好关联的。根据格斯塔理论,可以认为网页是一个不可分割的整体。简化复杂信息,获取主要信息,对一系列的问题进行整合。基于这种两种思想,结合网页之间的关联性和网页的整体性,可以有效地判断是否为钓鱼网页。
[Zhang2007]Y.Zhang,J.Hong,and L.Cranor.Cantina:A content-based approachto detecting phishing websites.WWW,2007.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110112442.1/2.html,转载请声明来源钻瓜专利网。