[发明专利]分布式数据集存储和检索有效
申请号: | 201680029014.3 | 申请日: | 2016-07-27 |
公开(公告)号: | CN108701076B | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | B.P.鲍曼;S.E.克吕格尔;R.T.奈特;C-W.候 | 申请(专利权)人: | 赛思研究所 |
主分类号: | G06F12/02 | 分类号: | G06F12/02;G06F3/06;G06F16/22;G06F16/27 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 徐红燕;郑冀之 |
地址: | 美国北卡*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 装置包括处理器组件,使得所述处理器组件:检索数据集内的数据的组织的元数据以及数据文件内的数据块的组织的映射数据;接收哪些节点设备可用于利用数据集部分执行处理任务的指示;和响应于数据集包括分区数据,比较可用节点设备的数量和存储数据集中最后涉及到的节点设备的数量。响应于匹配,针对映射数据映射条目:检索用于数据子块的散列化标识符以及用于对应数据块内的每个数据子块的大小;将散列化标识符除以可用节点设备的数量;将模值与分配给每个可用节点设备的指定进行比较;和向分配了匹配指定的可用节点设备提供指针。 | ||
搜索关键词: | 分布式 数据 存储 检索 | ||
【主权项】:
1.一种装置,包括处理器组件和存储指令的存储装置,所述指令当由处理器组件执行时使得处理器组件执行操作,所述操作包括:通过网络从一个或多个存储设备检索指示数据集内的数据的组织的元数据以及指示由一个或多个存储设备所维持的数据文件内的多个数据块的组织的映射数据,其中:映射数据包括多个映射条目;和所述多个映射条目中的每个映射条目对应于所述多个数据块中的一个或多个数据块;从多个节点设备接收所述多个节点设备中的哪些节点设备是各自能够利用一个或多个数据集部分中的至少一个数据集部分执行处理任务的可用节点设备的指示;和响应于数据集包括分区数据的元数据或映射数据内的指示,其中数据集内的数据被组织到每个可分布到单个节点设备的多个分区中,并且每个映射条目对应于单个数据块:基于哪些节点设备是可用节点设备的指示来确定可用节点设备的第一数量;从元数据或映射数据检索在数据文件内的数据集的存储中最后涉及到的节点设备的第二数量;比较节点设备的第一和第二数量以检测第一和第二数量之间的匹配;向可用节点设备中的每一个分配一系列正整数值中的一个作为指定值,其中所述系列从整数值0延伸至等于第一数量减去整数值1的正整数值;和响应于检测到第一和第二数量之间的匹配,针对映射数据的每个映射条目:从映射条目检索在映射条目中被指示为在对应数据块内的一个数据子块的散列化标识符以及在映射条目中被指示为在对应数据块内的每个数据子块的数据子块大小,其中:散列化标识符从多个分区中的分区的分区标签导出;和数据子块包括一个或多个数据集部分中的数据集部分;确定数据文件内的对应数据块的位置;将散列化标识符除以第一数量以获得模值;将模值与分配给每个可用节点设备的指定值进行比较,以标识被分配了与模值匹配的指定值的可用节点设备;和向被分配了与模值匹配的指定值的可用节点设备提供指针,所述指针包括:对应数据块的位置的指示;和对应数据块内的所有数据子块的数据子块大小的总和。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛思研究所,未经赛思研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680029014.3/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置