[发明专利]一种支持HiveDML增强的混合存储系统及其方法有效

专利信息
申请号: 201310618652.7 申请日: 2013-11-29
公开(公告)号: CN103678519B 公开(公告)日: 2017-03-29
发明(设计)人: 黄硕;虎嵩林;梁英;谷丹阳;吴凯锋;李祥珍;洪建光;张春光;肖政;裴旭斌;衡星辰;崔蔚 申请(专利权)人: 中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京律诚同业知识产权代理有限公司11006 代理人: 祁建国,李岩
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 hivedml 增强 混合 存储系统 及其 方法
【说明书】:

技术领域

发明涉及到大数据环境下,使Apache Hive高效的实现DML(Data Manipulation Language数据操作语言)操作的混合存储系统的开发与实现,特别涉及支持Hive DML增强的混合存储系统。 

背景技术

Hive为基于Hadoop的数据分析提供了类SQL接口,减少了MapReduce开发量,同时方便了从现有的提供SQL接口的关系数据仓库向Hadoop生态系统的转换。Hive能够将用户定义的数据表模式映射到底层的数据存储之上,并基于MapReduce实现对数据的查询与操作。但是,受制于较弱的DML支持,Hive在企业级大数据处理中无法充分发挥效能。学术界和工业界进行了大量Hive优化的工作,包括了查询方案优化、执行系统优化、存储系统优化等方面。 

(1)查询方案优化 

在2011年The International Conference on Distributed Computing Systems(国际分布式计算系统会议)中Rubao Lee等人公开了一篇名为“YSmart:Yet another SQL-to-MapReduce Translator”的文献,YSmart能够在复杂的查询中发现关联的操作并基于规则对其化简来产生包含MapReduce任务最少的执行方案,从而减少查询时间。在2011年ACM Symposium on Cloud Computing(ACM云计算研讨会)上Sai Wu等人公开了一篇名为“Query Optimization for Massively Parallel Data Processing”的文献,提出了一个Hive的优化器AQUA,它能够对查询中多个JOIN进行分组并基于代价模型选择最优的方案;在The38th International Conference on Very Large Data Bases(第38届国际超大规模数据库会议)上Harold Lim等人公开了一篇名为“Stubby:A Transformation-based Optimizer for MapReduce Workflows”的文献,提出了一个面向MapReduce工作流的优化器Stubby,它能基于一系列的变换(transformation)规则搜索出查询方案各种变体中最高效的一个。这些工作目 标在于提高Hive的查询性能,并没有为Hive带来DML操作的增强。 

(2)执行系统优化 

Hortonworks公司提出了Tez框架,基于Hadoop的第二代MapReduce框架YARN让Hadoop更好的执行DAG(Directed Acyclic Graph,有向无环图)工作流,减少Hive查询执行时不必要的中间任务和数据,从而缩短Hive查询响应时间。UC Berkeley大学开发的Shark(http://spark.incubator.apache.org/)在内存计算框架Spark的基础之上提供了与Hive兼容的接口,使得现有的Hive查询能够获得内存计算带来的加速。此外,学术界进行了大量MapReduce框架相关的优化工作,例如MRShare、Starfish、各种调度器等。这些工作都能够对基于MapReduce的Hive带来好处。这些工作缩短了Hive查询响应时间,但没有增强Hive的DML能力。 

(3)存储系统优化 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司,未经中国科学院计算技术研究所;国网浙江省电力公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310618652.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top