[发明专利]文件对象模型事务爬行器在审

专利信息
申请号: 201710700555.0 申请日: 2017-08-16
公开(公告)号: CN107798051A 公开(公告)日: 2018-03-13
发明(设计)人: T·C·斯韦德隆德;K·A·威廉姆斯;B·C·金 申请(专利权)人: 安提特软件有限责任公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司11018 代理人: 史迎雪,康泉
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文件 对象 模型 事务 爬行
【说明书】:

背景技术

网络爬行器(crawler)识别网页内容,以使得实体能够自动地确定网页内容而无需用户与该网页交互。网络爬行器可使用网页的超文本标记语言(HTML)、网页的文件对象模型(DOM)等识别网页的内容。一些网页可能包括网络应用,该网络应用使用户能够经由该网络应用与网页和/或网页的特征交互。

附图说明

图1例示了包括可根据本公开的方面实施的文件对象模型(DOM)事务爬行器的示例性DOM爬行器系统的示意图;

图2是可用于实施图1中的DOM事务爬行器的示例性DOM事务爬行器的框图;

图3例示了根据本文的示例、可由图2中的DOM事务爬行器遍历的、DOM的示例性事件树;

图4是表示可被执行以实施图2中的DOM事务爬行器的示例性机器可读指令的流程图;

图5是表示示例性机器可读指令的流程图,该示例性机器可读指令可被执行以实施根据本公开的方面的图2中的DOM事务爬行器,从而通过管理事务并且存储DOM的状态之间的状态变化而实现以隔离的方式执行事件;

图6是表示示例性机器可读指令的流程图,该示例性机器可读指令可被运行以实施根据本公开的方面的图2中的DOM事务爬行器,从而执行遍历事件的迭代;

图7是能够执行图4、图5和/或图6中的指令从而实施图2中的DOM事务爬行器的示例性处理器平台的框图。

在任何可能情况下,在本文中的各附图以及相应说明中使用相同的附图标记指代相同或类似的部件。

具体实施方式

本文公开的示例涉及用于导航(navigate)网页或者网络应用(例如,单页面应用或其他动态应用)的文件对象模型(DOM)事务爬行器(transaction crawler)。

一般来说,网络爬行器用于自动地(不需要任何用户交互,除了可能初始化爬行器之外)发现网络应用的内容。然而,在没有正确理解应用的内容的情况下,可能无法识别网络应用中的所有事件(或者安全扫描器的所有攻击点)。大型动态站点(例如,单页面应用(SPA))的内容可能是经由DOM以及通过代码(例如,JavaScript)驱动的DOM的各状态之间的转换(transition)来表示的。为了使爬行器能发现DOM转换,该爬行器获取DOM的知识,从而使用探试算法导航DOM转换,如同用户可能会导航网络应用。然而,网络应用的事件空间会变得很大并且足以使得爬行难以驾驭。为了精确地导航DOM,从网络爬行器第一次与网络应用交互开始,以精确的顺序执行事件并且请求资源。其结果是,可能需要重复地加载并执行整个网络应用,从而到达DOM的每个转换。在本文的示例中,网络事务爬行器记录运行DOM的事件时的原子态变化,使得可将状态变化复原(revert)到运行该事件之前的先前状态。相应地,本文的示例提供一种有效并且有效率地遍历网络应用的DOM的手段,无需重复运行该网络应用以到达该DOM的每个转换或事件。

在本文的示例中,通过执行事件、识别响应于事件的执行的状态变化、以及在事务日志中记录(或存储)该状态变化来遍历事件。相应地,基于记录的状态变化,可将事务返回到执行该应用的任何事件之前的先前状态,以使得可识别并执行DOM中的任何剩余事件,就好像事件未被执行过一样。同样地,复原(例如,回滚(rolling back))由事件的执行产生的状态变化,并且可回放该状态变化(通过取回并实施DOM中的状态变化)以爬行DOM而无需重新执行事件。

本文的示例涉及:识别文件对象模型的第一状态中的事件。该事件被执行以引起从该文件对象模型的第一状态到该文件对象模型的第二状态的状态变化。而且,该状态变化可被存储在事务日志中,从而存储文件对象模型的第一状态与文件对象模型的第二状态之间的差别。示例还涉及:将文件对象模型从文件对象模型的第二状态复原到文件对象模型的第一状态,以用于执行文件对象模型的第一状态的后续事件。

如本文使用的,网页或者网络应用的内容可指:可经由该网页或网络应用提供和/或获取的任意文本、图形、图片、用户界面、可点击的(例如,按键、下拉等等)、鼠标悬停等等。此外,网页或网络应用可互换地使用,然而网络应用(或者SPA)可能包含在网页中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安提特软件有限责任公司,未经安提特软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710700555.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top