[发明专利]一种大数据的数据处理系统及方法有效

专利信息
申请号: 201611051473.X 申请日: 2016-11-24
公开(公告)号: CN106776810B 公开(公告)日: 2020-10-16
发明(设计)人: 黄强 申请(专利权)人: 广东数果科技有限公司
主分类号: G06F16/182 分类号: G06F16/182;G06F16/22;G06F16/242
代理公司: 广州市越秀区哲力专利商标事务所(普通合伙) 44288 代理人: 罗峰
地址: 510000 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 数据处理系统 方法
【说明书】:

发明公开了一种大数据的数据处理系统及方法,该系统包括容器节点模块、数据查询节点模块、历史数据节点模块、zoopeeker和HDFS,所述zoopeeker用于协调管理所述容器节点模块、数据查询节点模块以及历史数据节点模块的工作状态;数据查询节点模块用于获取查询条件并生成对应的查询任务,然后将对应的查询任务分配给容器节点模块以及历史数据节点模块,并接收容器节点模块返回的第一查询结果以及容器节点模块返回的第二查询结果;所述数据查询节点模块还用于根据第一查询结果和第二查询结果生成最终查询结果并输出。本发明能够大大提高查询性能,从而实现真正意义上的大数据的加速。

技术领域

本发明涉及大数据领域,尤其涉及一种大数据领域的数据处理系统及方法。

背景技术

当前的大数据的方案解决了数据存储和分析,然后分析的性能低,究其原因为:缺少索引技术,来提高数据快速扫描和聚合;缺少针对索引分片合并的分布式索引技术。一般来说,采用如下三种方案:

1、OLAP(On-Line Analysis Processing,联机分析处理)解决方案,其利用了Hbase作为存储,对数据进行预聚合处理,可以满足常用的报表需求,但只支持少量数据维度。

2、GreenPlum,其是一种MPP(Massive Parallel Processor,大量并行处理)数据库,主要涉及思想是每台机器一个数据库,利用并行计算能力提高查询分析速度,在一定数据量的情况下做到秒级响应,但是其集群规模有上限,无法满足大数据的实时分析查询。

3、Presto或Impala,其利用Parquet或者OrcFile作为底层数据存储,同Hbase一样作为简单的列式存储,在查询有限维度的情况下有不错的查询效果,但缺少正向索引,在多维查询或者聚合查询时性能较差。

针对上述三种方案:第一种,采用OLAP的方式,可以满足业务报表需求,但是缺点非常明显,需要多数据做预聚合处理,在预聚合的过程中会损失数据信息的完整性,无法满足的大数据信息挖掘。另外,大数据的OLAP通常是一种用空间换时间的方案,反向索引的功能较弱,在维度数据较多基数较大的情况下,数据会急剧膨胀,最终导致数据查询分析性能低。第二种,采用MPP的方式,由于采用的是没有中心节点的存储模型,集群节点扩展不方便,且在上百个节点后,难以继续扩展。另外,MPP采用的精细化内存管理,这在小数据量的情况下能做到低延迟,但在大数据量的情况下,无法做到高IO,同时也会导致计算时大量消耗CPU。第三种,采用Parqeut、OrcFile或者Hbase等简单的列式存储,这种方式能够在一定程度上解决数据查询IO高的问题,查询维度较多时,IO的问题依然存在,查询性能也随之下降。另外,由于缺少正向索引,在查询分析需要对数据进行聚合时,无法做到低延迟,并且IO相当高。

发明内容

为了克服现有技术的不足,本发明的目的之一在于提供一种大数据的处理系统,其能够提高大数据中处理数据的查询性能,实现大数据的加速。

本发明的目的之一采用以下技术方案实现:

本发明提供了一种大数据的数据处理系统,包括容器节点模块、数据查询节点模块、历史数据节点模块、zoopeeker和HDFS,所述容器节点模块、数据查询节点模块、历史数据节点模块分别与zoopeeker数据通信,所述容器节点模块、历史数据节点模块分别与HDFS数据通信;所述zoopeeker用于协调管理所述容器节点模块、数据查询节点模块以及历史数据节点模块的工作状态;

所述数据查询节点用于接收查询条件并根据所述查询条件生成对应的查询任务,然后将所述查询任务分发到历史数据节点模块以及容器节点模块;

所述容器节点模块用于获取外部实时数据,并根据对应的查询任务以及外部实时数据得出第一查询结果,并将所述第一查询结果返回给数据查询节点模块;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东数果科技有限公司,未经广东数果科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611051473.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top