[发明专利]检测网页内容变更的方法及装置有效

专利信息
申请号: 201210129996.7 申请日: 2012-04-27
公开(公告)号: CN102682098A 公开(公告)日: 2012-09-19
发明(设计)人: 张振虎;王晓明;龙柯;王兴;罗宇;付德龙 申请(专利权)人: 北京神州绿盟信息安全科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 刘芳
地址: 100089 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 检测 网页 内容 变更 方法 装置
【说明书】:

技术领域

发明涉及网络技术,尤其涉及一种检测网页内容变更的方法及装置。

背景技术

随着互联网技术的不断发展,网站为用户提供了实时的丰富多彩的内容,如新闻、公告、论坛等,由于各种因素,网站被黑客入侵,网站页面内容被篡改的事件屡有发生,需要对网站页面内容变更进行实时检测。

现有的检测网页内容变更的方法主要是判断网页超文本标记语言(Hypertext Markup Language,简称HTML)源码是否发生了改变,但是,通过确定HTML源码发生改变的方法无法判断网页变更是否合法,这时仍然需要网络管理员通过人工检测的方法确定网页发生变更的合法性。

发明人在实现本发明的过程中发现:由于网站页面数量庞大,现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。

发明内容

本发明提供一种检测网页内容变更的方法及装置,解决了现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。

本发明的第一个方面是提供一种检测网页内容变更的方法,包括:

将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树;

将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树;

将所述第一DOM树中所有的子树与所述第二DOM树中所有的子树进行匹配,确定所述第一DOM树中与所述第二DOM树中每一子树的变更类型;

若所述子树的变更类型为预设的需要进行合法验证的变更类型,则获取所述子树对应的变更内容;

查询内容权重列表,确定所述子树对应的变更内容的权重等级;

若所述子树对应的变更内容的权重等级大于预设的非法变更等级,则确定所述子树的变更类型为非法变更。

本发明的另一个方面是提供一种检测网页内容变更的装置,包括:

生成模块,用于将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树;

第一确定模块,用于将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树;

第二确定模块,用于将所述第一DOM树中所有的子树与所述第二DOM树中所有的子树进行匹配,确定所述第一DOM树中与所述第二DOM树中每一子树的变更类型;

获取模块,用于若所述子树的变更类型为预设的需要进行合法验证的变更类型,则获取所述子树对应的变更内容;

查询模块,用于查询内容权重列表,确定所述子树对应的变更内容的权重等级;

第三确定模块,用于若所述子树对应的变更内容的权重等级大于预设的非法变更等级,则确定所述子树的变更类型为非法变更。

本发明实施例采用比较两棵DOM树的方法,可以确定两棵DOM树中每一子树的变更类型,若确定所述子树的变更类型为预设的需要进行合法验证的变更类型,则进一步获取所述子树对应的变更内容,通过查询内容权重列表确定所述子树的变更类型是否为非法变更,解决了现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。

附图说明

图1为本发明实施例一提供的检测网页内容变更的方法的流程示意图;

图2为图1所示实施例采用的DOM树的结构示意图;

图3为图1所示实施例中步骤103的一种具体实现的流程示意图;

图4为本发明实施例二提供的检测网页内容变更的装置的结构示意图。

具体实施方式

图1为本发明实施例一提供的检测网页内容变更的方法的流程示意图,如图1所示,包括:

步骤101、将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树。

举例来说,从网络数据资源中将第一网页的HTML文档的内容,对该HTML文档进行规范化检验,使用HTML解析器对检验后的规范化的HTML文档进行解析,形成一棵基于文档对象模型(Document Object Model,简称DOM)的解析树(简称第一DOM树),第一DOM树中形象地标识出了HTML各节点的层次关系及各自的属性及相应的文本值,同理可以将第二网页生成第二DOM树。

步骤102、将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州绿盟信息安全科技股份有限公司,未经北京神州绿盟信息安全科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210129996.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top