[发明专利]大数据钻取分析方法、装置、设备及存储介质在审
申请号: | 202211314141.1 | 申请日: | 2022-10-25 |
公开(公告)号: | CN115878608A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 王深湛;万龙;高旸;陈文杰;雷腾;聂东;彭康 | 申请(专利权)人: | 南斗六星系统集成有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455;G06F16/2458;G06F16/25;G06F16/26;G06F16/28 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 余浩 |
地址: | 430056 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 方法 装置 设备 存储 介质 | ||
本发明公开了一种大数据钻取分析方法、装置、设备及存储介质,所述方法通过将kafka中采集的实时数据进行消费,并将消费数据写入维度索引和事实索引中存储;将维度索引中的目标维度数据一次性读取出来,将目标维度数据组装成树状结构,并将树状结构一次性加载到Redis数据库中用Map数据结构进行缓存;根据数据钻取请求获取事实索引中的目标事实数据,将目标事实数据关联到Map数据结构对应的维度树中,进行赋值和递归相加,获得数据分析结果,该方法不但能够更快地获取数据,显著提升了查询性能,而且实时性高,响应快,能够支持无限下钻,降低了维护成本,提升了大数据钻取分析的速度和效率。
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种大数据钻取分析方法、装置、设备及存储介质。
背景技术
随着大数据时代的到来,面对数据量的爆发式增长,如何高效地从海量数据中分析出有效的信息来指导宏观决策已成为一个需要解决的重大问题,现有的数据分析方式是通过建立数据仓库的模型,再配合数据库仓库技术:抽取-转换-加载(Extract-Transform-Load,ETL)工具将数据载入数据仓库,最后通过结构化查询语言(Structured QueryLanguage,SQL)语句完成数据分析需求;在大数据时代,这种传统做法存在的弊端已经越来越明显,主要包括:
响应速度慢:无论是在关系数据库还是在大数据仓库中进行数据分析,当数据量达到千万以上后,SQL查询语句的执行速度极慢,通常需要几十秒甚至几分钟才能得到分析的结果,用户体验很差;
数据仓库模型复杂:为了完成数据分析的需求,需要创建维度表和事实表并进行关联,当维度数量较多且维度数据存在层级关系时,需要提前计算好各个维度下的统计值存储在事实表中,计算量很大;
维护成本较高:当数据分析的需求发生变更时,例如原本的功能是省、市、县三级钻取分析,现在要改为省、市、县、街道四级钻取,需要在事实表中新增街道维度的字段并导入街道维度的统计值,修改的工作量很大。
发明内容
本发明的主要目的在于提供一种大数据钻取分析方法、装置、设备及存储介质,旨在解决现有技术中数据钻取响应速度慢,数据仓库模型复杂及维护成本高,大数据钻取效率低下的技术问题。
第一方面,本发明提供一种大数据钻取分析方法,所述大数据钻取分析方法包括以下步骤:
将kafka中采集的实时数据进行消费,并将消费数据写入维度索引和事实索引中存储;
将所述维度索引中的目标维度数据一次性读取出来,将所述目标维度数据组装成树状结构,并将所述树状结构一次性加载到Redis数据库中用Map数据结构进行缓存;
根据数据钻取请求获取所述事实索引中的目标事实数据,将所述目标事实数据关联到所述Map数据结构对应的维度树中,进行赋值和递归相加,获得数据分析结果,并对所述数据分析结果进行可视化展示。
可选地,所述将kafka中采集的实时数据进行消费,并将消费数据写入维度索引和事实索引中存储之前,所述大数据钻取分析方法还包括:
使用ETL工具抽取数据到kafka中,以完成数据采集。
可选地,所述使用ETL工具抽取数据到kafka中,以完成数据采集,包括:
根据预设事实索引结构和预设维度索引结构,并使用ETL工具将待处理的维度数据和事实数据进行抽取、加工和清洗后投递到kafka消息总线,以完成数据采集。
可选地,所述使用ETL工具抽取数据到kafka中,以完成数据采集之前,所述大数据钻取分析方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南斗六星系统集成有限公司,未经南斗六星系统集成有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211314141.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种审核管理系统及方法
- 下一篇:一种钠离子电池的原料粉碎研磨装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置