[发明专利]Hadoop文件系统数据自定义分块方法有效

申请号：	201510320303.6	申请日：	2015-06-12
公开（公告）号：	CN106250380B	公开（公告）日：	2019-08-23
发明（设计）人：	亢永敢;赵改善;杨祥森;孙成龙;许自龙;段文超;杨文广	申请（专利权）人：	中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院
主分类号：	G06F16/11	分类号：	G06F16/11;G06F16/182;G06F16/18
代理公司：	北京思创毕升专利事务所 11218	代理人：	刘明华
地址：	100728 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	提出了一种Hadoop文件系统数据自定义分块方法，包括：对输入数据进行排序；根据预先设置的数据分块参数，对排序后的输入数据进行分块，以得到数据块，其中对排序后的输入数据进行分块包括：将每个数据块在排序后的输入数据中的起始位置和终止位置记录在与每个数据块相对应的分块信息中；以及基于所述分块信息，从排序后的输入数据中读取相应的数据块，以进行并行处理。
搜索关键词：	hadoop 文件系统数据自定义分块方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种Hadoop文件系统数据自定义分块方法，包括：对输入数据进行排序；根据预先设置的数据分块参数，对排序后的输入数据进行分块，以得到数据块，其中对排序后的输入数据进行分块包括：将每个数据块在排序后的输入数据中的起始位置和终止位置记录在与每个数据块相对应的分块信息中；以及基于所述分块信息，从排序后的输入数据中读取相应的数据块，以进行并行处理；其中，所述输入数据是基于Hadoop文件系统将实体数据固定分块后存储的数据；所述根据预先设置的数据分块参数，对排序后的输入数据进行分块包括：根据以下数据分块参数中的一个或多个，对排序后的共偏移距道集数据进行分块：最小偏移值、最大偏移距值、偏移距分组间隔、以及每个数据块中的最大道数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院，未经中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510320303.6/，转载请声明来源钻瓜专利网。

上一篇：中国电视剧剧本数据分析法
下一篇：用于确定表格式存储的列布局的系统和方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]Hadoop文件系统数据自定义分块方法有效

专利文献下载