[发明专利]数据处理方法、装置及计算机设备在审
申请号: | 202110755957.7 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113392131A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 李文博 | 申请(专利权)人: | 上海幻电信息科技有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455;G06F16/27 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 邓小玲;王勇 |
地址: | 200120 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 设备 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取待处理的目标数据集;
根据预设数量的标识码对所述目标数据集中的每一个数据进行标记,得到已标记数据集;
根据所述标记码将所述已标记数据集的数据输入到不同的计算节点进行数据处理;
将所有计算节点输出的已标记数据去除标识码并进行存储。
2.如权利要求1所述的数据处理方法,其特征在于,所述根据预设数量的标识码对所述目标数据集中的每一个数据进行标记,包括:
根据所述计算节点的数量生成预设数量的标识码;
将所述预设数量的标识码的每一个标识码对所述目标数据集中的均衡数量的数据进行标记。
3.如权利要求2所述的数据处理方法,其特征在于,所述根据所述计算节点的数量生成预设数量的标识码,包括:
生成与所述计算节点的数量相等或在所述计算节点的数量的预设波动范围内的数量的随机正整数作为标识码。
4.如权利要求1-3中任一项所述的数据处理方法,其特征在于,所述根据预设数量的标识码对所述目标数据集中的每一个数据进行标记,包括:
将所述标识码以前缀或后缀的方式添加到所述目标数据集中的每一个数据中。
5.如权利要求4所述的数据处理方法,其特征在于,当所述目标数据集中的数据为(key,value)类型数据时,所述将标识码以前缀或后缀的方式添加到所述目标数据集中的每一个数据中,包括:
将标识码添加到所述目标数据的key字段。
6.如权利要求5所述的数据处理方法,其特征在于,所述将所有计算节点输出的已标记数据去除标识码并进行存储,包括:
根据key值对已标记数据集中的数据进行一次聚合,得到第一数据集;
将所述第一数据集中的每一个数据的标识码去除;
根据key值对去除标识码后的所述第一数据集中的数据进行二次聚合,得到第二数据集,并存储到预设存储单元。
7.如权利要求6所述的数据处理方法,其特征在于,
在执行所述一次聚合或所述二次聚合的过程中,当多个数据聚合成一个目标数据时,将所述多个数据的数量标记到所述目标数据。
8.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取待处理的目标数据集;
标记模块,用于根据预设数量的标识码对所述目标数据集中的每一个数据进行标记,得到已标记数据集;
处理模块,用于根据所述标记码将所述已标记数据集的数据输入到不同的计算节点进行数据处理;
存储模块,用于将所有计算节点输出的已标记数据去除标识码并进行存储。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1~7中任一项所述的数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1~7中任一项所述的数据处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海幻电信息科技有限公司,未经上海幻电信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110755957.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空间吸声体承重龙骨与管桁架连接装置及其安装方法
- 下一篇:加热装置