[发明专利]一种Web请求关联的分析方法和装置有效
申请号: | 201910731410.6 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110633431B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 张颖;黄非凡;黄罡;梅宏 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;H04L67/02 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 江黎 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 web 请求 关联 分析 方法 装置 | ||
1.一种Web请求关联的分析方法,其特征在于,包括以下步骤:
记录浏览Web页面过程中产生的Web请求序列;
从Web请求序列中选取一项,作为待生成API的头部请求;
根据头部请求,在Web请求序列中进行第一次后继搜索;如果搜索到后继请求,则将头部请求与后继请求整合为一个API;如果未搜索到后继请求,则根据头部请求,在Web请求序列中进行前驱搜索;所述后继搜索是指搜索在次序逻辑和关联逻辑中紧接于当前请求之后的其它请求,所述前驱搜索是指搜索在次序逻辑和关联逻辑中紧接于当前请求之前的其它请求;
所述前驱搜索如果未搜索到前驱请求,则将头部请求生成API;如果搜索到前驱请求,则根据前驱请求,在Web请求序列中进行第二次后继搜索;
所述第二次后继搜索如果搜索到后继请求,则将头部请求与后继请求整合为一个API;如果未搜索到后继请求,则将头部请求生成API。
2.根据权利要求1所述的方法,其特征在于,所述记录浏览Web页面过程中产生的Web请求序列,是在定制的容器中浏览Web页面并记录Web请求序列;所述定制的容器是在浏览器内核的基础上增加对Web请求数据的管理,实现能够浏览网页并在浏览过程中记录Web请求数据的容器。
3.根据权利要求1所述的方法,其特征在于,所述记录浏览Web页面过程中产生的Web请求序列,是采用代理的方式,在本地浏览器和公共网络之间增加一层代理程序,使得本地浏览器和公共网络之间传输的Web请求数据能够完整地被代理程序记录下来。
4.根据权利要求1所述的方法,其特征在于,所述Web请求序列中记录的内容包括URL、响应包体和请求开始时刻。
5.根据权利要求1所述的方法,其特征在于,所述第一次后继搜索按以下过滤条件对所有Web请求进行筛选:
1)资源文件类型为HTML;
2)该Web请求的开始时刻,在头部请求的开始时刻之后;
3)头部请求的响应包体中包含该Web请求URL的路径部分,或包含路径部分的子路径。
6.根据权利要求1所述的方法,其特征在于,所述前驱搜索按以下过滤条件对所有Web请求进行筛选:
1)资源文件类型为HTML或JavaScript;
2)该Web请求的开始时刻,在头部请求的开始时刻之前;
3)该Web请求的响应包体中包含头部请求URL的路径部分,或包含路径部分的子路径。
7.根据权利要求1所述的方法,其特征在于,所述第二次后继搜索按以下过滤条件对所有Web请求进行筛选:
1)资源文件类型为HTML;
2)该Web请求的开始时刻,在头部请求的开始时刻之后;
3)所得前驱请求的响应包体中包含该Web请求URL的路径部分,或包含路径部分的子路径。
8.一种Web请求关联的分析装置,其特征在于,包括:
Web请求序列记录模块,负责记录浏览Web页面过程中产生的Web请求序列;
Web请求关联搜索模块,负责从所述Web请求序列中选取一项,作为待生成API的头部请求;根据头部请求,在Web请求序列中进行第一次后继搜索;如果搜索到后继请求,则将头部请求与后继请求整合为一个API;如果未搜索到后继请求,则根据头部请求,在Web请求序列中进行前驱搜索;所述前驱搜索如果未搜索到前驱请求,则将头部请求生成API;如果搜索到前驱请求,则根据前驱请求,在Web请求序列中进行第二次后继搜索;所述第二次后继搜索如果搜索到后继请求,则将头部请求与后继请求整合为一个API;如果未搜索到后继请求,则将头部请求生成API;所述后继搜索是指搜索在次序逻辑和关联逻辑中紧接于当前请求之后的其它请求,所述前驱搜索是指搜索在次序逻辑和关联逻辑中紧接于当前请求之前的其它请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910731410.6/1.html,转载请声明来源钻瓜专利网。