[发明专利]可动态扩展的分布式爬虫系统、数据处理方法及装置在审
申请号: | 202011598949.8 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112650570A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 陈志坚 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/54;G06F16/951 |
代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
地址: | 巴西班让路枫树*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了可动态扩展的分布式爬虫系统、数据处理方法及装置。本申请实施例提供的技术方案通过优化系统,在爬虫任务配置中隔离爬虫任务配置和条件配置,在执行爬虫任务时对不同任务信息的爬虫任务列入不同的任务队列等待,并且多线程分别执行不停任务队列的爬虫任务;通过降低系统内部的耦合度、提高了可动态扩展性能,避免内存泄露,大大提高开发效率,以及提高系统的吞吐量。 | ||
搜索关键词: | 动态 扩展 分布式 爬虫 系统 数据处理 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011598949.8/,转载请声明来源钻瓜专利网。