[发明专利]由钓鱼网页查找目标网页的方法有效

专利信息
申请号: 201210051171.8 申请日: 2012-03-01
公开(公告)号: CN102629261A 公开(公告)日: 2012-08-08
发明(设计)人: 张卫丰;田先桃;张迎周;周国强;王慕妮;周国富;许碧欢;陆柳敏;顾赛赛 申请(专利权)人: 南京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 叶连生
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 钓鱼 网页 查找 目标 方法
【说明书】:

技术领域

发明涉及一种由钓鱼网页查找目标网页的方法,主要从钓鱼网页与对应目标网页之间在文本和图像特征之间的相似性来查找目标网页,以更新钓鱼检测时所需要的白名单,属于信息安全领域。

 

背景技术

钓鱼网站是随着网络普及和在线交易的增加而变得异常猖獗的网络诈骗行为。钓鱼网站是犯罪分子模仿合法网页做出的诈骗网站,钓鱼网站通常与银行网站或其他知名网站几乎完全相同,从而引诱网站使用者在钓鱼网站上提交出敏感信息,如:用户名、口令、银行帐号或信用卡详细信息等。

最典型的网络钓鱼攻击过程如下:首先将用户引诱到一个通过精心设计与目标组织的网站非常相似的钓鱼网站上,然后获取用户在该钓鱼网站上输入的个人敏感信息,例如银行帐号、银行密码等。通常这个攻击过程不会让受害者警觉。这些个人信息对钓鱼网站持有者具有非常大的吸引力,通过使用窃取到的个人信息,他们可以假冒受害者进行欺诈性金融交易,获得极大的经济利益,而受害者们却因此而遭受到巨大的经济损失,非但如此,被窃取的个人信息还可能被用于其他非法活动。如何识别钓鱼网站,如何保证网站信息传输的保密完整性,愈发的显示出其重要性和必要性。

大多数用户会受骗,很多时候是由于钓鱼网页总是与真实网页有高度的相似性。如果我们能从相似性的角度检测钓鱼网页,不失为一个很好的方法。然而在钓鱼检测的过程中,除了钓鱼检测方法外,特征库的好坏也直接影响到检测的准确率,如何能找到钓鱼网页的目标网页,是本发明的研究重点。Zhang在2007年提出CANTINA[Zhang2007],该方法通过借助第三方工具,比如搜索引擎,来检测钓鱼网页,它首先统计网页中词的TF-IDF(TF-IDF,词频-反文档频率,是一种统计方法,用以评估一个字或词对于一个文件集或一个语料库中的其中一份文件的重要程度),把TF-IDF排序靠前的几个词条利用搜索引擎检索,如果该网页不出现在搜索结果的前面30个结果中,则认为是钓鱼网页。该方法具有较高的精度和较小的误判率。但是该方法只是基于网页内容的,对于一种文字很少,图片很多的网页,或者是文字在图片中的网页将无能为力。本发明将从文本和图片两种途径提取关键词,然后在多个搜索引擎上检索,综合多个搜索引擎的结果,最后再从图片角度利用图像感知哈技术查找最相似的目标网页。

[Zhang2007] Y. Zhang, J. Hong, and L. Cranor. Cantina: A content-based approach to detecting phishing websites. WWW, 2007.

[Fu2006] Anthony Y. Fu, Wenyin Liu, Xiaotie Deng. Detecting Phishing Web Pages with Visual Similarity Assessment based on Earth Mover’s Distance (EMD). IEEE Transactions on Dependable and Secure Computing, 2006, 3(4), pages 301-311.

[Dong2010]X. Dong, J. A. Clark, J. L. Jacob. Defending the weakest link: phishing websites detection by analysing user behaviours. Springer Science+Business Media, LLC 2010.

[Cao2009]Jiuxin Cao,Bo Mao,Junzhou Luo, and Bo Liu. A Phishing Web Pages Detection Algorithm Based on Nested Structure of Earth Mover’s Distance (Nested-EMD).  Chinese Journal of Computers2009, (05): 922-929.

[Chen2009]K.-T. Chen, J.-Y. Chen, C.-R. Huang, and C.-S. Chen. Fighting Phishing with Discriminative Keypoint Features of Webpages. IEEE Internet Computing, 2009.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210051171.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top