[发明专利]一种基于HBase的数据存储优化方法及系统有效
申请号: | 202110549557.0 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113031878B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 宋成平 | 申请(专利权)人: | 睿至科技集团有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F16/22;G06F16/27 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 段旺 |
地址: | 100005 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hbase 数据 存储 优化 方法 系统 | ||
1.一种基于HBase的数据存储优化方法,其特征在于,该方法包括如下步骤:
预先构建电力数据采集风险评估模型;
根据风险评估模型判断是否允许采集电力数据,若是,则采集电力数据,否则,禁止采集电力数据;
将采集的电力数据作为待存储数据上传至HBase开源数据库;
根据需求数据的特点,对待存储数据进行分析,获取其中的需求字段数据和缺失字段数据,并反馈缺失字段数据;
将需求字段数据按照列式存储方式存储至中台;
依据缺失字段数据,通过列动态扩展的方式对中台存储的数据进行补充;
其中,根据风险评估模型判断是否允许采集电力数据的方法包括:
采集系统运行特征数据和电力数据采集装置运行特征数据,并输入风险评估模型;
风险评估模型根据系统运行特征数据和电力数据采集装置运行特征数据,计算采集数据异常风险评估值;
在采集数据异常风险评估值低于预设阈值时,采集电力数据,否则,禁止采集电力数据;
其中,计算采集数据异常风险评估值包括如下子步骤:
根据电力系统运行特征数据,计算电力系统异常值;
根据电力数据采集装置运行特征数据,计算电力数据采集装置异常值;
根据电力系统异常值和电力数据采集装置的异常值,计算采集数据异常风险评估值;
其中,电力系统异常值的计算公式如下:
;
其中,Hd表示电力系统异常值;T2表示采集电力系统运行特征数据的总时长;N表示电力系统运行特征数据的类别总数量;Qj表示第j种类别电力系统运行特征数据对电力系统异常值的影响权重;Dbj表示第j种类别电力系统运行特征数据的标准值;Dsjt表示第j种类别电力系统运行特征数据在第t时刻的实际测量值;T1表示频率波动的持续时长;Aft表示电力系统t时刻的频率偏差值;Yft表示电力系统允许的频率偏差值。
2.根据权利要求1所述的基于HBase的数据存储优化方法,其特征在于,电力数据上传过程中,依据预先设定的核查规则,进行数据质量分析核查,以获取上传数据中对应字段的空值数据量。
3.根据权利要求1所述的基于HBase的数据存储优化方法,其特征在于,待存储数据具有多个属性分量,属性分量包括:行键、时间戳、列簇和列限定符。
4.根据权利要求1或3所述的基于HBase的数据存储优化方法,其特征在于,将需求字段数据按照列式存储方式存储至中台的方法包括:设定各需求业务字段对应的列,依据各需求业务字段对应的列,将需求字段数据按照列式存储方式存储至中台。
5.根据权利要求1所述的基于HBase的数据存储优化方法,其特征在于,需求字段数据按照列式存储方式存储至中台的业务数据表中,所述业务数据表具有行和列,每一行代表一个数据对象,每一行都包括一个行键,以及一个或多个列。
6.根据权利要求1所述的基于HBase的数据存储优化方法,其特征在于,采集系统运行特征数据的方法为:采集一段时间内的电力系统运行特征数据,电力系统运行特征数据包括:电压、电流、频率偏差值、振荡和调度负荷。
7.根据权利要求6所述的基于HBase的数据存储优化方法,其特征在于,电力数据采集装置运行特征数据包括:工作电流、工作电压和工作频率。
8.根据权利要求7所述的基于HBase的数据存储优化方法,其特征在于,采集数据异常风险评估值的计算公式如下:
;
其中,Fc表示采集数据异常风险评估值,K1表示电力系统异常值对采集数据异常风险评估值的影响权重;K2表示电力数据采集装置的异常值对采集数据异常风险评估值的影响权重;Hd表示电力系统异常值;Hc表示电力数据采集装置的异常值。
9.一种基于HBase的数据存储优化系统,其特征在于,该系统包括:
异常特征数据采集装置,用于采集系统运行特征数据和电力数据采集装置运行特征数据;
数据处理器,用于根据系统运行特征数据和电力数据采集装置运行特征数据,计算采集数据异常风险评估值;
电力数据采集装置,用于在采集数据异常风险评估值低于预设阈值时,采集电力数据,否则,禁止采集电力数据;
数据传输模块,用于将采集的电力数据作为待存储数据上传至HBase开源数据库;
获取模块,用于根据需求数据的特点,对待存储数据进行分析,获取其中需求字段数据和缺失字段数据,并反馈缺失字段数据;
数据存储模块,用于将需求字段数据按照列式存储方式存储至中台;
数据补充模块,用于依据缺失字段数据,通过列动态扩展的方式对中台存储的数据进行补充;
其中,计算采集数据异常风险评估值包括如下子步骤:
根据电力系统运行特征数据,计算电力系统异常值;
根据电力数据采集装置运行特征数据,计算电力数据采集装置异常值;
根据电力系统异常值和电力数据采集装置的异常值,计算采集数据异常风险评估值;
其中,电力系统异常值的计算公式如下:
;
其中,Hd表示电力系统异常值;T2表示采集电力系统运行特征数据的总时长;N表示电力系统运行特征数据的类别总数量;Qj表示第j种类别电力系统运行特征数据对电力系统异常值的影响权重;Dbj表示第j种类别电力系统运行特征数据的标准值;Dsjt表示第j种类别电力系统运行特征数据在第t时刻的实际测量值;T1表示频率波动的持续时长;Aft表示电力系统t时刻的频率偏差值;Yft表示电力系统允许的频率偏差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿至科技集团有限公司,未经睿至科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110549557.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置