[发明专利]一种基于HBase的数据存储优化方法及系统有效
申请号: | 202110549557.0 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113031878B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 宋成平 | 申请(专利权)人: | 睿至科技集团有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F16/22;G06F16/27 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 段旺 |
地址: | 100005 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hbase 数据 存储 优化 方法 系统 | ||
本申请提供一种基于HBase的数据存储优化方法及系统,该方法包括如下步骤:采集系统运行特征数据和电力数据采集装置运行特征数据;根据系统运行特征数据和电力数据采集装置运行特征数据,计算采集数据异常风险评估值;在采集数据异常风险评估值低于预设阈值时,采集电力数据,否则,禁止采集电力数据;将采集的电力数据上传至HBase开源数据库;根据需求数据的特点,对待存储数据进行分析,获取其中需求字段数据和缺失字段数据;将需求字段数据按照列式存储方式存储至中台;依据缺失字段数据,对中台存储的数据进行补充。本申请在保证数据安全可靠的前提下,完成业务数据的灵活存储,减少了存储空间资源的占用。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于HBase的数据存储优化方法及系统。
背景技术
电力数据中台中业务数据随着电网业务的发展不断积累,并形成了常态化的数据监测和数据分析业务体系,依托设备明细负荷数据及运营效率等计算指标,在业务实际操作过程中,电力系统的数据中台实现按业务数据需求从各业务系统中离线、准实时、实时地进行数据的采集、存储何交换,并以总部、省、地市三级横向协同、纵向贯通的运营管控体系,实现了经营绩效、管理效率、运营效率等监测业务的常态化运行,为发展规划、电网运行等提供相关决策支撑。
在这一过程中有大量的业务数据及非业务数据写入数据中台相关数据库中,同时采用全量接入+周期抽取的方式进行数据的抽取及存储,以满足业务系统数据接入及后续数据分析的基本要求。
目前电力数据中台中业务数据,通过全量接入+周期抽取的方式将数据抽取存储至相关数据库中。在这一过程中,由于省侧数据清洗规则及数据质量核查不规范,导致接入数据中存在数据缺失的问题,例如,业务数据表中某些字段数据大量缺失。这些等待修改补充的数据表在反馈至省侧之前会堆积在数据库中,大量占用数据库的存储空间,降低数据的查询效率,并且不能实时进行数据填补,只能等待省侧修改后进行表级别的数据更新,这显然不利于中台业务数据的快速转换。
如图1所示,存在部分数据的缺失,而由于传统数据库存储方式的关系,缺失字段仍会占据相关数据存储空间,这就造成了数据中台大量存储空间被白白占用。
此外,用于业务数据过程中,源表一般为宽表,有着大量的数据字段,而对应业务分析过程中所需要的数据字段较少,因此在表数据更新或分析过程中会涉及大量的字段数据查询及修改,同时产生较大的小表,这也会降低业务数据存储分析的效率。
发明内容
本申请的目的在于提供一种基于HBase的数据存储优化方法及系统,该方法实现了电力数据中台业务数据存储过程的优化,在保证数据安全、可靠、及一致的前提下,完成业务数据的灵活存储,减少了缺失数据对存储空间资源的占用。
为达到上述目的,本申请提供一种基于HBase的数据存储优化方法,该方法包括如下步骤:
预先构建电力数据采集风险评估模型;
根据风险评估模型判断是否允许采集电力数据,若是,则采集电力数据,否则,禁止采集电力数据;
将采集的电力数据作为待存储数据上传至HBase开源数据库;
根据需求数据的特点,对待存储数据进行分析,获取其中需求字段数据和缺失字段数据,并反馈缺失字段数据;
将需求字段数据按照列式存储方式存储至中台;
依据缺失字段数据,通过列动态扩展的方式对中台存储的数据进行补充;
其中,根据风险评估模型判断是否允许采集电力数据的方法包括:
采集系统运行特征数据和电力数据采集装置运行特征数据,并输入风险评估模型;
风险评估模型根据系统运行特征数据和电力数据采集装置运行特征数据,计算采集数据异常风险评估值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿至科技集团有限公司,未经睿至科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110549557.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置