[发明专利]僵尸网站的检测方法在审
申请号: | 201710298791.4 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107133310A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 周银行;杨东;董郑江;胡淦;陈焕;郑中华 | 申请(专利权)人: | 安徽博约信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 沈尚林 |
地址: | 230000 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种僵尸网站的检测方法。该检测方法包括网络信息收集和索引、网站可用性检测、网站信息更新检测和网站综合打分及僵尸网站判定等4个步骤。本发明通过采集相应网站信息,进行信息抽取和索引后,使用既定的网站评价指标(网站可用性、网站信息更新频率等)对网站是否僵尸网站进行检测,实现了对网站是否僵尸网站的有效判别。 | ||
搜索关键词: | 僵尸 网站 检测 方法 | ||
【主权项】:
僵尸网站的检测方法,包括以下步骤:(1)网络信息收集和索引使用网络信息采集雷达采集网站发布的互联网信息,所述的互联网信息为htm1格式,运用网页预处理算法对正文中的标题、发表时间、正文进行数据提取,重点对发表时间进行多种校验,保证提取的时间的正确性;而后将提取后的数据发送到索引模块,索引模块在对上述字段进行分词处理后,建立倒排索引,实现文本的检索;(2)网站可用性检测基于上述采集引擎,实现对网站可用性的检测,主要是对网站在检测时间段内是否可访问、网站页面链接是否可访问、网站页面链接的响应时间三方面内容进行监测,综合不可访问次数比例进行打分,该分数作为后续僵尸网站检测时的网站可用性权重;(3)网站信息更新检测基于所采集的数据,考虑每一个网站的栏目设置、及信息来源各个栏目数量等指标,在给定的时间段内按照预先设定的评判标准对网站的更新频率进行加权计算,对每个网站的信息更新指数进行打分,该分数作为后续僵尸网站检测时的网站信息更新频率权重;(4)网站综合打分及僵尸网站判定根据用户设定的统计时间间隔,计算出每个时间段各个网站的可用性、网站信息更新情况;然后对每个时间段内的网站按照预先设定的标准进行加权打分;根据计算的网站综合打分对网站是否是僵尸网站进行检测,利用设定好的网站指标对网站进行判别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽博约信息科技股份有限公司,未经安徽博约信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710298791.4/,转载请声明来源钻瓜专利网。