[发明专利]一种钓鱼网站检测方法有效

申请号：	201210477139.6	申请日：	2012-11-21
公开（公告）号：	CN103023874A	公开（公告）日：	2013-04-03
发明（设计）人：	李坤;毛剑;刘建伟;冯克;李佩	申请（专利权）人：	北京航空航天大学
主分类号：	H04L29/06	分类号：	H04L29/06;H04L29/08
代理公司：	北京慧泉知识产权代理有限公司 11232	代理人：	王顺荣;唐爱华
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明一种钓鱼网站检测方法，步骤如下：1、CSS文本提取，按照不同的存在形式分别进行提取；将以上提取的所有的CSS字符串合并到同一个文件中；2、CSS文本解析，使用CSS解析器对步骤1得到的CSS文件进行自动解析，得到对应的规则对象集合；3、比较元提取，从规则集合中选择带某些特征的属性并重新整合，以便于相似度的快速计算；4、相似度计算，根据两个网页的比较元集合的匹配情况计算相似度。本发明有以下优点：1)轻量级，算法轻量级，易于使用浏览器扩展实现；2)普适性强，由于正常网站内所有网页一般采用统一的样式风格，因此只需检测可疑网页与目标网站内任一个网页是否匹配即可，而且不受网页语言种类的限制；3)低误报。
搜索关键词：	一种钓鱼网站检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种钓鱼网站检测方法，其特征在于：该方法步骤如下：步骤一：层叠样式表CSS文本提取超文本标记语言HTML文件的层叠样式表CSS有3种存在形式：外部样式表、内部样式表和内联样式表，按照不同的存在形式分别进行提取；将以上提取的所有的层叠样式表CSS字符串合并到同一个文件中；步骤二：层叠样式表CSS文本解析使用层叠样式表CSS解析器对步骤一得到的层叠样式表CSS文件进行自动解析，得到对应的规则对象集合；每条规则对象为键-值结构，包含该规则的规则类型、选择器名称及声明集合；规则类型表明该条规则是否是注释或者一条有功能的层叠样式表CSS语句；选择器名称表明该规则应用的目标；声明集合保存对相应目标使用的样式，集合中的每个元素都是对当前选择器一条属性描述，包括属性名称和属性值信息；对于层叠样式表CSS文件中复合属性的条目在解析时自动分解为多个单属性集合；步骤三：比较元提取从规则集合中选择带某些特征的属性并重新整合，以便于相似度的快速计算；对于值具有数字特征的属性，进一步处理生成比较元；比较元为“键：值”对，以便于查找和比较；其中，键为属性和属性值的链接，值为拥有该属性和属性值的选择器集合；步骤四：相似度计算根据两个网页的比较元集合的匹配情况计算相似度；假设有比较元集合A和B，A对B的相似度定义为：A对B的相似度等于A与B的匹配集合得分与A的比较元总分之比；即：在计算匹配得分和总分时需经以下几个步骤：1)权值设定；对不同的匹配元素设定不同的权值；比较元的键的权值设为s₁，即当比较元集合A中某个比较元的键在比较元集合B中存在，则将匹配得分加s₁；比较元的值为选择器数组，数组中的不同类型的选择器对应不同的权值；令超文本标记语言HTML标签选择器的权值为s₂，派生选择器的权值为s₃，类选择器的权值为s₄，ID选择器的权值为s₅；2)得分计算；A的总分的计算方式为：其中k₂、k₃、k₄、k₅分别为对应的比较元超文本标记语言HTML标签选择器、派生选择器、类选择器、ID选择器的个数；A的匹配得分的计算方式为：集合A中任一比较元的键在比较元集合B中存在，则将匹配得分加s₁，若不存在则该比较元得分为0；若集合B存在该键，然后比较该键对应值中选择器的匹配数目，根据匹配类型的权值计算匹配得分总和；3)相似度计算；A对B的相似度为A与B的匹配得分与A的比较元总分之比。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210477139.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种钓鱼网站检测方法有效

专利文献下载