[发明专利]一种支持HiveDML增强的混合存储系统及其方法有效

专利信息
申请号: 201310618652.7 申请日: 2013-11-29
公开(公告)号: CN103678519B 公开(公告)日: 2017-03-29
发明(设计)人: 黄硕;虎嵩林;梁英;谷丹阳;吴凯锋;李祥珍;洪建光;张春光;肖政;裴旭斌;衡星辰;崔蔚 申请(专利权)人: 中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京律诚同业知识产权代理有限公司11006 代理人: 祁建国,李岩
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 hivedml 增强 混合 存储系统 及其 方法
【权利要求书】:

1.一种支持Hive DML增强的混合存储系统,其特征在于,包括: 

DualTable表创建模块:用于建立包含主表和附表,为每行数据维护了唯一ID并基于代价模型对外提供特定操作集的DualTable表; 

DualTable表执行模块:用于基于所述主表和所述附表实现对所述DualTable表中的数据读取和查询,基于所述附表实现对所述DualTable表中的数据进行更改,基于所述代价模型实现所述DualTable表提供的操作集,基于有序的每行数据的所述唯一ID实现所述主表和所述附表数据读取时的合并。 

2.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,所述维护每行数据唯一ID的机制用于维护每行数据唯一的ID,确保不同存储系统间读取数据有序合并。 

3.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,所述主表用于所述DualTable表的数据存储,采用分布式文件存储。 

4.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,所述附表用于存储所述DualTable表中数据的更改信息。 

5.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,所述操作集为所述DualTable提供的操作集合,包含:Union Read、UPDATE、DELETE、INSERT INTO、CREATE、DROP、LOAD和COMPACT。 

6.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,基于所述代价模型,实现所述UPDATE和DELETE操作。 

7.根据权利要求6所述支持Hive DML增强的混合存储系统,其特征在于,所述UPDATE操作和DELETE操作包括:OVERWRITE操作方式和EDIT操作方式。 

8.根据权利要求7所述支持Hive DML增强的混合存储系统,其特征在于,基于所述代价模型计算对所述OVERWRITE和EDIT操作方式进行动态选取。 

9.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,所述DualTable表执行模块,还包括: 

数据读取模块:通过专用输入格式读取所述DualTable表中的数据; 

数据查询模块:用于根据所述数据读取模块的读取数据,通过查询语句对所述DualTable中的数据进行查询; 

数据行ID管理模块:用于确保所述每行数据唯一ID在整个所述DualTable表中的唯一性; 

COMPACT模块:用于将DualTable表的附表中的数据合并进主表,并清空附表数据; 

代价模型模块:包含代价模型参数获取子模块,用于获取所述代价模型所需的计算参数,基于所述代价模型的估算,支持所述DualTable表的删除和更新操作的实现; 

删除和更新模块:用于基于所述代价模型模块的动态计算,实现所述UPDATE和所述DELETE操作。 

10.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,还包括: 

命令处理模块:用于外部向所述DualTable表提交命令,并将所述命令进行格式转换。 

11.根据权利要求1所述支持Hive DML增强的混合存储系统,其特征在于,还包括: 

并发控制模块:用于通过语句加锁机制,对需要操作的所述数据进行加锁,确保操作的并发控制。 

12.一种支持Hive DML增强的混合存储方法,应用于如权利要求1-11中任一项所述混合存储系统,所述系统基于DualTable表建立,所述混合存储方法,包括: 

DualTable表创建步骤:用于建立包含主表和附表,为每行数据维护了唯一ID并基于代价模型对外提供特定操作集的DualTable表; 

DualTable表执行步骤:用于基于所述主表和所述附表实现对所述DualTable表中的数据读取和查询,基于所述附表实现对所述DualTable表中的数据进行更改,基于所述代价模型实现所述DualTable表提供的操作集,基于有序的每行数据的所述唯一ID实现所述主表和所述附表数据读取时的合并。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司,未经中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310618652.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top