[发明专利]分布式系统中的数据处理方法及装置、计算设备在审
申请号: | 201811242816.X | 申请日: | 2018-10-24 |
公开(公告)号: | CN109298947A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 沈迪;杜延龙;王素梅;李铮;徐皓 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;赵娅 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分布式系统中的数据处理方法及装置、计算设备,方法包括:根据预设倾斜阈值,判断多个第一关键字中是否存在至少一个第一关键字对应的数据造成数据倾斜;若是,将至少一个第一关键字对应的数据进行分组处理,得到多个数据分组,并根据预设映射规则生成与多个数据分组对应的多个第二关键字;将多个第二关键字对应的数据分组分配给分布式系统中的多个计算节点分别处理;将处理后的多个第二关键字对应的数据分组进行合并处理,还原得到至少一个第一关键字对应的数据。通过判断数据是否造成数据倾斜,对造成数据倾斜的数据进行分组处理,将多个数据分组分配给分布式系统中的多个计算节点分别处理,将数据进行平衡,消除数据倾斜。 | ||
搜索关键词: | 数据分组 分布式系统 分组处理 计算节点 计算设备 数据处理 预设 合并处理 判断数据 映射规则 分配 还原 平衡 | ||
【主权项】:
1.一种分布式系统中的数据处理方法,其包括:根据预设倾斜阈值,判断多个第一关键字中是否存在至少一个第一关键字对应的数据造成数据倾斜;其中,每个第一关键字对应的数据被分布式系统中的一个计算节点处理;若是,将所述至少一个第一关键字对应的数据进行分组处理,得到多个数据分组,并根据预设映射规则生成与多个数据分组对应的多个第二关键字;将多个第二关键字对应的数据分组分配给分布式系统中的多个计算节点分别处理;将处理后的多个第二关键字对应的数据分组进行合并处理,还原得到所述至少一个第一关键字对应的数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811242816.X/,转载请声明来源钻瓜专利网。