[发明专利]获取数据资源的方法和装置有效
申请号: | 201810841913.4 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109150984B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张驰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F16/953;G06F16/9535;G06F16/958 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 数据 资源 方法 装置 | ||
1.一种获取数据资源的方法,其特征在于,包括:
通过网络爬虫触发对数据资源更新系统的可扩展超文本传输请求,所述网络爬虫通过模拟目标方式获取所述数据资源更新系统的数据,所述目标方式为浏览器通过超文本传输协议HTTP获取所述数据资源更新系统的数据的方式,其中,所述数据资源更新系统为用于提供数据资源下载服务的网站系统;
将所述网络爬虫的可扩展超文本传输对象下的所有方法和所有属性保存到全局对象中,以备份所述网络爬虫的可扩展超文本传输对象下的所有方法和所有属性;
创建保存在所述全局对象中的所述可扩展超文本传输对象对应的可扩展超文本传输实例,遍历所述可扩展超文本传输实例的所有属性和所有方法,为所述可扩展超文本传输实例的各个方法生成其对应的代理方法,为所述可扩展超文本传输实例的各个属性生成其对应的代理属性,以得到所述可扩展超文本传输对象对应的可扩展超文本传输对象代理;
通过所述可扩展超文本传输对象代理截取所述可扩展超文本传输请求以及所述可扩展超文本传输请求对应的返回数据,以获取所述可扩展超文本传输请求对应的交互流量数据,所述交互流量数据包括所述可扩展超文本传输请求和所述返回数据,所述返回数据包括网页数据;
从所述交互流量数据中获取与第一下载目的对应的流量数据保存到本地。
2.根据权利要求1所述的方法,其特征在于,所述从所述交互流量数据中获取与第一下载目的对应的流量数据保存到本地包括:
对所述交互流量数据进行分类,以确定所述交互数据流量中的各个流量数据所属的数据资源类别;
根据数据资源类别与下载目的的关联关系确定与所述第一下载目的对应的第一数据资源类别;
将所述交互流量数据中属于所述第一数据资源类别的流量数据保存到本地。
3.根据权利要求2所述的方法,其特征在于,所述对所述交互流量数据进行分类包括:
根据所述交互流量数据的格式对所述交互流量数据进行分类。
4.根据权利要求2所述的方法,其特征在于,所述对所述交互流量数据进行分类包括:
将所述交互流量数据作为预设的流量数据分类模型的输入对所述交互流量数据进行分类。
5.根据权利要求4所述的方法,其特征在于,所述对所述交互流量数据进行分类之前还包括:
确定多个流量数据以及所述多个流量数据所属的数据资源类别;
将所述多个流量数据以及所述多个流量数据所属的数据资源类别作为训练样本,基于分类算法对流量数据分类模型进行训练得到最逼近所述训练样本的流量数据分类模型;
将所述最逼近所述训练样本的流量数据分类模型确定为所述预设的流量数据分类模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述通过网络爬虫触发对数据资源更新系统的可扩展超文本传输请求包括:
在本地创建所述网络爬虫的可扩展超文本传输对象,并为所述可扩展超文本传输对象注册回调方法;
设置与所述数据资源更新系统对应的后台服务器交互的参数和向所述后台服务器发送的流量数据;
启动与所述后台服务器的通信交互。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810841913.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置