[发明专利]用于处理数据的方法、装置和系统有效
申请号: | 201811396773.0 | 申请日: | 2018-11-22 |
公开(公告)号: | CN109508326B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 李豪;宋展;张建伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/2458;G06F9/50 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 数据 方法 装置 系统 | ||
本申请实施例公开了用于处理数据的方法、装置和系统。该方法的一具体实施方式包括:响应于接收到待处理的键值对数据,根据键确定键值对数据的分片编号。根据分片编号从预设的分片树中确定目标分片编号,其中,分片树为二叉树结构,节点表征至少一个分片编号,节点与存储目录相对应。将键值对数据推送到目标分片编号对应的第二端,以供第二端将键值对数据写入第二端对应的存储目录。该实施方式提高了数据处理效率。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于处理数据的系统、方法和装置。
背景技术
如今的互联网技术不断发展,数据成爆炸式增长,网络上数据规模急剧增加,混乱的数据中蕴藏着巨大的商机,可以从海量的数据中提取价值。但随之而来的问题是单机的数据处理能力无法满足当今海量数据应用的处理要求,基于大规模计算集群的分布式计算成为未来数据性能提升的主要途径。
发明内容
本申请实施例提出了用于处理数据的方法和装置。
第一方面,本申请实施例提供了一种用于处理数据的方法,包括:响应于接收到待处理的键值对数据,根据键确定用于处理数据的键值对数据的分片编号;根据用于处理数据的分片编号从预设的分片树中确定目标分片编号,其中,用于处理数据的分片树为二叉树结构,节点表征至少一个分片编号,节点与存储目录相对应;将用于处理数据的键值对数据推送到用于处理数据的目标分片编号对应的第二端。
在一些实施例中,用于处理数据的方法还包括:响应于确定出用于处理数据的键值对数据的分片编号对应的叶子节点已经从用于处理数据的分片树中删除,将已经删除的叶子节点的父节点对应的至少一个分片编号中最小的分片编号确定为目标分片编号。
第二方面,本申请实施例提供了一种用于处理数据的装置,包括:接收单元,被配置成响应于接收到待处理的键值对数据,根据键确定用于处理数据的键值对数据的分片编号;确定单元,被配置成根据用于处理数据的分片编号从预设的分片树中确定目标分片编号,其中,用于处理数据的分片树为二叉树结构,节点表征至少一个分片编号,节点与存储目录相对应;推送单元,被配置成将用于处理数据的键值对数据推送到用于处理数据的目标分片编号对应的第二端。
在一些实施例中,用于处理数据的确定单元进一步被配置成:响应于确定出用于处理数据的键值对数据的分片编号对应的叶子节点已经从用于处理数据的分片树中删除,将已经删除的叶子节点的父节点对应的至少一个分片编号中最小的分片编号确定为目标分片编号。
第三方面,本申请实施例提供了一种用于处理数据的系统,包括至少一个第一端,至少一个第二端,至少一个第三端:至少一个第一端,被配置成响应于接收到待处理的键值对数据,根据键确定用于处理数据的键值对数据的分片编号;根据用于处理数据的分片编号从预设的分片树中确定目标分片编号,其中,用于处理数据的分片树为二叉树结构,节点表征至少一个分片编号,节点与存储目录相对应;将用于处理数据的键值对数据推送到用于处理数据的目标分片编号对应的第二端;至少一个第二端,被配置成响应于接收到用于处理数据的键值对数据,将用于处理数据的键值对数据写入该第二端对应的存储目录;至少一个第三端,被配置成根据用于处理数据的分片树中该第三端对应的叶子节点到根节点的最短路径,依次读取用于处理数据的最短路径上的节点对应的存储目录中的键值对数据。
在一些实施例中,用于处理数据的系统还包括管理端,被配置成:根据至少一个第二端的数量构造平衡二叉树作为分片树。
在一些实施例中,管理端进一步被配置成:获取预定时间内各第二端收到的文件的大小的平均值;对于至少一个第二端中的第二端,若该第二端收到的文件的大小的平均值小于预定阈值,删除用于处理数据的分片树中该第二端对应的叶子节点。
在一些实施例中,至少一个第一端,进一步被配置成:响应于确定出用于处理数据的键值对数据的分片编号对应的叶子节点已经从用于处理数据的分片树中删除,将已经删除的叶子节点的父节点对应的至少一个分片编号中最小的分片编号确定为目标分片编号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811396773.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置