[发明专利]分布式数据处理方法、装置、系统及电子设备在审
申请号: | 201910926425.8 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110704536A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 宋鹏威;杜宇飞 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/2458 |
代理公司: | 11330 北京市立方律师事务所 | 代理人: | 张筱宁 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种分布式数据处理方法、装置、系统及电子设备,涉及信息处理技术领域。包括:主控节点获取待处理的非结构化数据的相关信息,将非结构化数据的相关信息划分为各分片数据,发送给至少一个读写节点,每个读写节点将接收到的每个分片数据划分为至少两个子分片数据,并发送给至少一个工作节点,每个工作节点对接收到的每个子分片数据进行相应的处理。本申请通过设置不同处理任务的主控节点、读写节点、工作节点,实现了对非结构化数据的相关信息的分布式处理;将非结构化数据的相关信息分配到不同节点进行并行处理,或者将非结构化数据的相关信息通过节点的不同进程进行并行处理,从而实现了对大规模非结构化数据的高效处理。 | ||
搜索关键词: | 非结构化数据 相关信息 分片数据 工作节点 读写 并行处理 主控节点 分布式数据处理 信息处理技术 分布式处理 电子设备 高效处理 申请 并发 分配 进程 | ||
【主权项】:
1.一种分布式数据处理方法,其特征在于,所述方法包括:/n获取待处理的非结构化数据的相关信息,将所述相关信息进行分片处理,得到各分片数据;/n将各所述分片数据发送给至少一个读写节点,以使每个读写节点将接收到的分片数据读取为至少两个子分片数据,并将各子分片数据发送给至少一个工作节点,以使每个所述工作节点对接收到的每个所述子分片数据进行相应的处理;/n其中,若一个工作节点接收到至少两个子分片数据,则所述工作节点开启相应数量的进程,由相应数量的进程对接收到的至少两个子分片数据进行并行处理。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910926425.8/,转载请声明来源钻瓜专利网。