[发明专利]一种数据存储系统及其存储方法在审
申请号: | 202110110508.7 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112835895A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 王媛;仇国祥;何成;熊腾辉 | 申请(专利权)人: | 世纪龙信息网络有限责任公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/248;G06F16/25;G06F16/27;G06F16/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 苏云辉 |
地址: | 510000 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 存储系统 及其 存储 方法 | ||
本申请公开了一种数据存储系统及其存储方法,其中存储系统包括:数据采集单元、数据处理单元、数据存储单元、数据应用单元和展示单元;数据采集单元,用于从业务子系统中采集子系统数据;数据处理单元,用于将子系统数据进行预处理,得到预处理数据,并将预处理数据通过预置接口发送至数据存储单元;数据存储单元上搭建有Kylin集群,且数据存储单元中的存储数据库包括MySQL;数据存储单元,用于通过Kylin集群构建预处理数据的多维度表,并将预处理数据及通过Kylin集群预查询计算的结果数据存储至MySQL;数据应用单元,用于根据多维度表和MySQL中存储的结果数据,构建应用程序;展示单元,用于展示应用程序、预处理数据、多维度表和结果数据。
技术领域
本申请涉及数据库领域,尤其涉及一种数据存储系统及其存储方法。
背景技术
数据,是现代互联网发展的重要产物。随着企业的业务发展,大量数据分散在各子业务系统中,数据体量不断增大,隐藏的数据价值也随之增加。如何进行大规模数据的存储是研究人员的关注热点。
目前较为通用的大规模数据的存储系统是基于HBase+SparkSQL的系统,本系统的底层是Hadoop生态系统,通过在HBase上使用SparkSQL大规模数据计算引擎,兼容并优化了Hive的查询性能。本系统中SparkSQL是将数据读入到内存,通过内存来提高查询和计算性能。如果数据可以基本读入至内存,Spark的内存缓存会让SparkSQL有好的表现。然而对于超大规模的数据,Spark频繁的磁盘读写时性能会大幅下降。
发明内容
本申请提供了一种数据存储系统及其存储方法,解决了现有的数据存储系统对于超大规模的数据,Spark频繁的磁盘读写时性能会大幅下降的技术问题。
有鉴于此,本申请第一方面提供了一种数据存储系统,包括:数据采集单元、数据处理单元、数据存储单元、数据应用单元和展示单元;
所述数据采集单元,用于从业务子系统中采集子系统数据;
所述数据处理单元,用于将所述子系统数据进行预处理,得到预处理数据,并将所述预处理数据通过预置接口发送至数据存储单元;
所述数据存储单元上搭建有Kylin集群,且所述数据存储单元中的存储数据库包括MySQL;
数据存储单元,用于通过所述Kylin集群构建所述预处理数据的多维度表,并将所述预处理数据及通过所述Kylin集群预查询计算的结果数据存储至MySQL;
数据应用单元,用于根据所述多维度表和所述MySQL中存储的所述结果数据,构建应用程序;
展示单元,用于展示所述应用程序、所述预处理数据、所述多维度表和所述结果数据。
可选地,所述子系统数据包括:业务数据、服务日志、埋点数据、外部爬虫数据。
可选地,所述数据处理单元包括:
预处理子单元,用于将所述子系统数据进行转换、清洗和汇总,得到所述预处理数据;
发送子单元,用于将所述预处理数据通过预置接口发送至所述存储计算单元。
可选地,所述预处理单元,具体用于实时地将所述子系统数据进行转换、清洗和汇总,得到所述预处理数据。
可选地,所述预处理单元通过ETL工具获取所述子系统数据。
可选地,所述Kylin集群,还用于,响应于用户输入的查询请求,从所述MySQL中获取所述查询请求对应的查询数据。
可选地,所述展示单元,还用于将所述查询数据以报表的形式进行展示。
可选地,所述数据存储单元中的存储数据库还包括:Spark数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪龙信息网络有限责任公司,未经世纪龙信息网络有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110110508.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置