[发明专利]网络数据采集系统有效

专利信息
申请号: 202111167751.9 申请日: 2021-10-08
公开(公告)号: CN113590988B 公开(公告)日: 2021-12-14
发明(设计)人: 张景龙;王殿胜;唐红武;薄满辉;翟性国;张乃钊;籍焱 申请(专利权)人: 中航信移动科技有限公司
主分类号: G06F16/955 分类号: G06F16/955;G06F16/958
代理公司: 北京锺维联合知识产权代理有限公司 11579 代理人: 丁慧玲
地址: 100041 北京市石景山*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络 数据 采集 系统
【权利要求书】:

1.一种网络数据采集系统,其特征在于,

包括预先配置的动态参数数据结构和请求处理数据结构,存储有计算机程序的存储器和处理器,所述动态参数数据结构和请求处理数据结构均为字符串数据结构,所述动态参数数据结构包括url参数数据段、请求方式数据段和至少一个请求参数数据段,所述url参数数据段、请求方式数据段和请求体参数数据段之间采用预设的第一分隔符分隔,不同请求体参数数据段之间通过预设的第二分隔符分隔,所述第一分隔符和第二分隔符不同;所述请求处理数据结构包括请求处理函数数据段、请求主体数据段和动态参数数据段,所述请求处理函数和所述请求主体数据段之间采用预设的第三分隔符分隔,请求主体数据段和动态参数数据段采用预设的第四分隔符分隔,所述第三分隔符和第四分隔符不同;

所述处理器在执行所述计算机程序时,实现以下步骤:

步骤S1、获取网络数据采集任务对应的url参数、请求方式和请求参数,根据所述动态参数数据结构生成任务动态参数数据体,存入所述请求处理数据结构中的动态参数数据段中;

步骤S2、调用所述请求处理数据结构中的请求处理函数,从所述任务动态参数数据体中获取动态参数数据填入所述请求主体数据段中生成任务请求主体;

步骤S3、基于所述任务请求主体采集目标网络数据。

2.根据权利要求1所述的系统,其特征在于,

所述系统还包括预先构建的用于破解加密参数的解密接口,所述步骤S1包括:

步骤S11、若所述网络数据采集任务的url链接为固定链接,则直接将url链接字符串确定为对应的url参数,并填入所述url参数数据段中;若url链接为需要url关键词拼接链接,则获取网络数据采集任务对应的url关键词,并将获取的url关键词进行拼接,并采用预设的第五分隔符进行分隔,生成对应的url参数,并填入所述url参数数据段中;

步骤S12、若所述网络数据采集任务为GET任务,则将所述请求方式数据段配置为GET,若所述网络数据采集任务为POST请求,则将所述请求方式数据段配置为POST;

步骤S13、获取网络数据采集任务的请求头,若所述请求头中包括请求头加密参数,则调用所述解密接口进行解密,生成请求头参数,并填入所述请求体参数数据段;若所述请求方式数据段配置为POST,则获取网络数据采集任务的表单数据,若所述表单数据中包括表单加密数据,则调用所述解密接口进行解密,生成表单参数,并填入所述请求体参数数据段,生成所述任务动态参数数据体。

3.根据权利要求2所述的系统,其特征在于,

所述解密接口为基于flask框架搭建的flask接口。

4.根据权利要求1所述的系统,其特征在于,

所述请求主体数据段包括url位置,数据头位置,表单数据位置,所述步骤S2包括:

步骤S21、调用所述请求处理数据结构中的请求处理函数,根据从所述任务动态参数数据体中的请求方式确定目标数据位置,从所述任务动态参数数据体中获取动态参数数据填入所述请求主体中对应的目标数据位置,或替换所述目标数据位置中的信息,生成任务请求主体。

5.根据权利要求1所述的系统,其特征在于,

所述系统还包括预先配置的响应处理数据结构,所述响应处理数据结构为字符串数据结构,包括数据解析函数数据段和解析路径数据段,所述数据解析函数数据段和解析路径数据段之间采用预设的第六分隔符分隔,所述数据解析函数数据段中的数据预先配置数据解析函数,当所述网络数据采集任务包括单个请求时,所述步骤S3包括:

步骤S31、基于所述任务请求主体确定任务解析路径数据,存储在所述解析路径数据段中;

步骤S32、调用数据解析函数数据段中对应的数据解析函数对所述任务解析路径数据进行解析,生成所述目标网络数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中航信移动科技有限公司,未经中航信移动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111167751.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top