[发明专利]检测网页内容变更的方法及装置有效
申请号: | 201210129996.7 | 申请日: | 2012-04-27 |
公开(公告)号: | CN102682098A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 张振虎;王晓明;龙柯;王兴;罗宇;付德龙 | 申请(专利权)人: | 北京神州绿盟信息安全科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 网页 内容 变更 方法 装置 | ||
技术领域
本发明涉及网络技术,尤其涉及一种检测网页内容变更的方法及装置。
背景技术
随着互联网技术的不断发展,网站为用户提供了实时的丰富多彩的内容,如新闻、公告、论坛等,由于各种因素,网站被黑客入侵,网站页面内容被篡改的事件屡有发生,需要对网站页面内容变更进行实时检测。
现有的检测网页内容变更的方法主要是判断网页超文本标记语言(Hypertext Markup Language,简称HTML)源码是否发生了改变,但是,通过确定HTML源码发生改变的方法无法判断网页变更是否合法,这时仍然需要网络管理员通过人工检测的方法确定网页发生变更的合法性。
发明人在实现本发明的过程中发现:由于网站页面数量庞大,现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。
发明内容
本发明提供一种检测网页内容变更的方法及装置,解决了现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。
本发明的第一个方面是提供一种检测网页内容变更的方法,包括:
将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树;
将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树;
将所述第一DOM树中所有的子树与所述第二DOM树中所有的子树进行匹配,确定所述第一DOM树中与所述第二DOM树中每一子树的变更类型;
若所述子树的变更类型为预设的需要进行合法验证的变更类型,则获取所述子树对应的变更内容;
查询内容权重列表,确定所述子树对应的变更内容的权重等级;
若所述子树对应的变更内容的权重等级大于预设的非法变更等级,则确定所述子树的变更类型为非法变更。
本发明的另一个方面是提供一种检测网页内容变更的装置,包括:
生成模块,用于将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树;
第一确定模块,用于将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树;
第二确定模块,用于将所述第一DOM树中所有的子树与所述第二DOM树中所有的子树进行匹配,确定所述第一DOM树中与所述第二DOM树中每一子树的变更类型;
获取模块,用于若所述子树的变更类型为预设的需要进行合法验证的变更类型,则获取所述子树对应的变更内容;
查询模块,用于查询内容权重列表,确定所述子树对应的变更内容的权重等级;
第三确定模块,用于若所述子树对应的变更内容的权重等级大于预设的非法变更等级,则确定所述子树的变更类型为非法变更。
本发明实施例采用比较两棵DOM树的方法,可以确定两棵DOM树中每一子树的变更类型,若确定所述子树的变更类型为预设的需要进行合法验证的变更类型,则进一步获取所述子树对应的变更内容,通过查询内容权重列表确定所述子树的变更类型是否为非法变更,解决了现有的检测网页内容变更的方法存在检测效率低、准确率低的问题。
附图说明
图1为本发明实施例一提供的检测网页内容变更的方法的流程示意图;
图2为图1所示实施例采用的DOM树的结构示意图;
图3为图1所示实施例中步骤103的一种具体实现的流程示意图;
图4为本发明实施例二提供的检测网页内容变更的装置的结构示意图。
具体实施方式
图1为本发明实施例一提供的检测网页内容变更的方法的流程示意图,如图1所示,包括:
步骤101、将第一网页生成第一文档对象模型DOM树,将第二网页生成第二DOM树。
举例来说,从网络数据资源中将第一网页的HTML文档的内容,对该HTML文档进行规范化检验,使用HTML解析器对检验后的规范化的HTML文档进行解析,形成一棵基于文档对象模型(Document Object Model,简称DOM)的解析树(简称第一DOM树),第一DOM树中形象地标识出了HTML各节点的层次关系及各自的属性及相应的文本值,同理可以将第二网页生成第二DOM树。
步骤102、将第一DOM树和第二DOM树进行比较,确定所述第一DOM树和所述第二DOM树为同源DOM树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州绿盟信息安全科技股份有限公司,未经北京神州绿盟信息安全科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210129996.7/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法