[发明专利]网页访问方法、装置、计算机设备及存储介质在审
申请号: | 202110121055.8 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112818199A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 伊娜 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 迟珊珊;杨毅玲 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 访问 方法 装置 计算机 设备 存储 介质 | ||
1.一种网页访问方法,其特征在于,所述网页访问方法包括:
响应于用户访问目标网页的访问请求,从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址;
根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数;
根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据;
根据所述多个目标参数数据生成参数索引;
对所述参数索引进行编码得到编码索引;
通过所述第二接口地址根据所述编码索引访问所述目标网页。
2.根据权利要求1所述的网页访问方法,其特征在于,所述对所述参数索引进行编码得到编码索引包括:
确定所述目标网页的参数长度;
根据所述参数长度对所述参数索引进行分割,得到多个参数子索引;
计算每个参数子索引中的参数的哈希值;
根据所述哈希值编码对应的参数子索引,得到编码子索引;
对多个所述编码子索引进行拼接,得到编码索引。
3.根据权利要求1所述的网页访问方法,其特征在于,所述方法还包括:
预先设置节点类型对应的节点权重;
获取所述目标网页对应的页面描述性文本,并生成所述页面描述性文本对应的页面树结构;
对所述页面树结构进行逐层遍历,确定每个字段对应的节点类型;
根据每个字段对应的节点类型和所述节点类型对应的节点权重,确定每个字段对应的权重;
根据字段对应的权重生成字段权重对照表。
4.根据权利要求3所述的网页访问方法,其特征在于,所述根据所述多个目标参数数据生成参数索引包括:
提取所述多个目标参数数据中的目标字段;
根据所述字段权重对照表确定每个目标字段的权重值;
将权重值大于权重阈值的目标字段对应的字段值作为第一索引词;
将权重值小于或等于所述权重阈值的目标字段对应的字段值作为第二索引词;
将所述多个目标参数数据中的非目标字段对应的字段值进行字符转换生成字符串;
根据所述第一索引词、所述第二索引词和所述字符串生成参数索引。
5.根据权利要求3所述的网页访问方法,其特征在于,所述根据所述第二接口地址,确定访问所述目标网页的多个目标需求参数包括:
计算所述页面树结构中每个节点对应的节点饱和度;
将节点饱和度小于预设饱和阈值的节点确定为目标节点;
确定所述目标节点对应的多个目标参数,并将所述多个目标参数作为访问所述目标网页的多个目标需求参数。
6.根据权利要求1-5任意一项所述的网页访问方法,其特征在于,所述从所述访问请求中提取所述访问请求对应的第一接口地址及所述目标网页对应的第二接口地址包括:
获取所述访问请求的请求报文;
从配置标签库中获取所述请求报文对应的报文分割标识符;
基于所述报文分割标识符对所述请求报文进行分割,得到地址片段;
基于语义解析,从所述地址片段中得到所述第一接口地址和所述第二接口地址。
7.根据权利要求1-5任意一项所述的网页访问方法,其特征在于,所述根据所述多个目标需求参数从所述第一接口地址中拉取多个目标参数数据包括:
从所述第一接口地址中获取所述访问请求对应的用户身份;
获取所述用户身份对应的Token;
提取所述Token中的多个字段;
将所述多个字段中的每个字段与每个目标需求参数进行匹配;
将与所述目标需求参数匹配成功的字段确定为目标字段;
将所述Token中所述目标字段对应的字段值,作为所述目标需求参数对应的目标参数数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110121055.8/1.html,转载请声明来源钻瓜专利网。