[发明专利]数据分布式存储系统及方法有效

专利信息
申请号: 201310150539.0 申请日: 2013-04-26
公开(公告)号: CN104123300B 公开(公告)日: 2017-10-13
发明(设计)人: 吴朱华;潘志铭 申请(专利权)人: 上海云人信息科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海金盛协力知识产权代理有限公司31242 代理人: 王松
地址: 201199 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明揭示了一种数据分布式存储系统及方法,所述系统包括节点集群模块、数据导入模块、存储模块;节点集群模块用以将集群内的数据节点连接对应的管理节点;数据导入模块用以对输入的数据按照设定大小的数据块进行扫描并载入内存,内存中的数据按照数据的特征值将其分组,而后将分组后的数据发送到相应数据节点;存储模块用以在数据节点接收到文件分片后将数据分片保留在内存中,数据节点输出日志至硬盘;判断内存中的数据大小是否超过所设定的阀值,如超过则将数据重新组织,压缩后写入硬盘,并删除对应的用户内存数据恢复的日志文件。本发明可以实现加速基于内存计算能力的集群;可提高对大规模数据的实时加载与处理能力,提升系统的响应时间。
搜索关键词: 数据 分布式 存储系统 方法
【主权项】:
一种数据分布式存储系统,其特征在于,所述系统包括:注册模块,用以通过客户端将集群内的数据节点注册到管理节点;数据导入模块,用以对输入的数据按照设定大小的数据块进行扫描并载入内存,内存中的数据按照数据的特征值将其分组,而后将分组后的数据发送到相应的数据节点;所述数据导入模块具体包括数据切分单元、数据扫描单元、数据分组规则匹配单元、数据分组单元、数据发送单元;所述数据切分单元用以对输入的数据按照设定大小的数据块进行扫描并载入内存;所述数据分组规则匹配单元用以根据不同的数据类型设定不同规则计算数据的特征值;所述数据分组单元用以将内存中经过扫描的设定大小数据块按照数据的特征值进行分组;所述数据发送单元将分组后的数据发送至相应的数据节点;存储模块,用以在数据节点接收到文件分片后将数据分片保留在内存中,判断是否需要将该数据备份到其它数据节点,如需要则通过备份模块进行备份;数据节点输出日志至硬盘,用于数据内存数据恢复;判断内存中的数据大小是否超过所设定的阀值,如超过则将数据按照元数据特征进行归类,经过数据的重新组织后,再进行压缩;对数据的重新组织的方式是按照数据的特征值,以及数据间的相似度进行排序,使得最大相似度的数据会连续存放,为下一步的数据压缩存储做准备;经过数据的重新组织以后,由于相似的数据会存放在一起,采用LZAM算法对其压缩,以取得较高的压缩率,然后再后写入硬盘,并删除对应的用户内存数据恢复的日志文件;备份模块,用以在数据传输到相应的数据节点上后,对该数据按照设定的备份数目进行备份,备份的数据将被分发到其它数据节点上;检索模块,用以在管理节点收到数据检索的请求后对相应数据进行检索;检索模块具体包括定位单元、失效判断单元、请求分发单元、检索单元、结果合并单元;管理节点通过定位单元定位数据检索请求所涉及的数据节点;管理节点通过失效判断单元采用Lease机制确定该数据节点是否失效,如失效则直接返回请求失败信息,若有效,管理节点通过请求分发单元分发请求到相应节点;数据节点接收数据检索请求后,通过检索单元对相应数据进行检索后返回结果到客户端;客户端利用结果合并单元将接收到的结果进行合并。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海云人信息科技有限公司,未经上海云人信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310150539.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top