[发明专利]网络访问分析方法、装置、计算机设备和存储介质在审
申请号: | 202011437017.5 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112579931A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 梁广鹏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 毛丹 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 访问 分析 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种网络访问分析方法、装置、计算机设备和存储介质。所述方法包括:获取目标访问地址集合;所述目标访问地址集合包括多个目标访问地址;提取各个目标访问地址中包含的目标字段和对应的字段值;基于同一目标字段对应的各个字段值的特征信息确定对应的目标字段的字段类型;基于各个目标字段和对应的字段类型生成所述目标访问地址集合对应的访问解析结果;所述访问解析结果用于对待处理访问地址进行访问处理。采用本方法能够提高访问查询、访问分析的效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种网络访问分析方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,网络上的信息资源日益丰富。用户可以通过URL(UniformResource Locator,统一资源定位符)访问网络上的资源。URL是指信息资源在网络上统一且唯一的地址。
传统技术中,对于URL的查询,用户需要准确知道待查询URL中包含的参数,基于已知参数去查询相应的URL。然而,对于未知参数的URL,用户就无法查询到对应的URL,导致URL查询效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高URL查询效率的网络访问分析方法、装置、计算机设备和存储介质。
一种网络访问分析方法,所述方法包括:
获取目标访问地址集合;目标访问地址集合包括多个目标访问地址;
提取各个目标访问地址中包含的目标字段和对应的字段值;
基于同一目标字段对应的各个字段值的特征信息确定对应的目标字段的字段类型;
基于各个目标字段和对应的字段类型生成目标访问地址集合对应的访问解析结果;访问解析结果用于对待处理访问地址进行访问处理。
在一个实施例中,获取目标访问地址集合,包括:获取多个候选访问地址;将同一访问接口对应的候选访问地址进行聚合,得到各个访问接口对应的候选访问地址集合;从各个候选访问地址集合中确定所述目标访问地址集合。
在一个实施例中,将同一访问接口对应的候选访问地址进行聚合,得到各个访问接口对应的候选访问地址集合,包括:提取候选访问地址中包含的访问主机信息和访问路径信息;将同一访问主机信息、访问路径信息对应的候选访问地址进行聚合,得到各个访问接口对应的候选访问地址集合。
在一个实施例中,提取各个目标访问地址中包含的目标字段和对应的字段值,包括:获取分割标识符;基于分割标识符将目标访问地址分割为多个候选字段和对应的候选字段值;基于分割标识符的类型从多个候选字段中确定目标字段,得到目标字段和对应的字段值。
在一个实施例中,基于同一目标字段对应的各个字段值的特征信息确定对应的目标字段的字段类型,包括:统计当前字段对应的各个字段值中各个字符的出现次数和当前字段对应的字段值数量;基于各个字符出现的次数和字段值数量计算各个字符的出现概率;基于各个字符的出现概率确定字符间的概率距离;当概率距离小于第二预设阈值时,确定当前字段对应的字段类型为无效字段类型。
一种网络访问分析装置,所述装置包括:
访问地址获取模块,用于获取目标访问地址集合;目标访问地址集合包括多个目标访问地址;
字段信息获取模块,用于提取各个目标访问地址中包含的目标字段和对应的字段值;
字段类型确定模块,用于基于同一目标字段对应的各个字段值的特征信息确定对应的目标字段的字段类型;
访问解析结果确定模块,用于基于各个目标字段和对应的字段类型生成目标访问地址集合对应的访问解析结果;访问解析结果用于对待处理访问地址进行访问处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011437017.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能小程序多端更新发布系统
- 下一篇:一种无核金桔蜜饯制备方法