[发明专利]一种能耗监测平台的异常数据处理方法及系统在审
申请号: | 201810030170.2 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108228862A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 支建杰;陈勤平;吴蔚沁 | 申请(专利权)人: | 上海市建筑科学研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/06 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 李庆 |
地址: | 200000 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 能耗监测平台 异常数据 异常数据处理 目标数据 数据修复 最近邻 预置 聚类算法 数据对应 预设条件 有效地 构建 | ||
本发明公开一种能耗监测平台的异常数据处理方法及系统,目的在于寻找更为有效的能耗监测平台的异常数据处理的方案,该能耗监测平台的异常数据处理方法包括构建目标数据集;按照预设条件识别目标数据集中的异常数据,判断异常数据的个数是否不小于预置个数;若异常数据的个数小于预置个数,则使用硬聚类算法二次识别目标日中的异常数据;选取与目标日的日逐时数据对应的最近邻的K日的日逐时数据,K为大于0的自然数,且K不大于M;根据最近邻的K日的日逐时数据修复目标日的日逐时数据。本发明通过有限的K日的日逐时数据修复目标日的日逐时数据,更为有效地处理能耗监测平台的异常数据。
技术领域
本发明涉及数据分析领域,具体而言,本发明涉及一种能耗监测平台的异常数据处理方法及系统。
背景技术
目前运行的能耗监测逐时数据对于异常数据的修复,理论上有提出了一阶差分法、时间序列预测方法等,一阶差分法适用于曲线平缓上升的逐时数据处理,但大量的公共建筑逐时能耗在主要设备打开后会有一个很大的跃变,且当连续缺失多个小时数据时,一阶差分法并不适用;时间序列预测非常适用于具有周期性的公共建筑逐时能耗数据,但其使用条件苛刻,需要有完备的历史数据,如果历史数据有缺失,还是需要采用其它方法去填补,而填补的准确性将影响到时间序列预测的结果。
发明内容
为了寻找更为有效的能耗监测平台的异常数据处理的方案,本发明一个实施例提供了一种能耗监测平台的异常数据处理方法,该能耗监测平台的异常数据处理方法包括如下步骤:
步骤S1:构建目标数据集,所述目标数据集合包括目标日的日逐时数据以及已修复的M日的日逐时数据,所述M为大于0的自然数;
步骤S3:按照预设条件识别所述目标数据集中的异常数据,判断所述异常数据的个数是否不小于预置个数;
步骤S5:若所述异常数据的个数小于所述预置个数,则使用硬聚类算法二次识别所述目标日中的异常数据;
步骤S7:选取与所述目标日的日逐时数据对应的最近邻的K日的日逐时数据,所述K为大于0的自然数,且所述K不大于所述M;
步骤S9:根据所述最近邻的K日的日逐时数据修复所述目标日的日逐时数据。
本发明中,所述步骤S3之后包括:
步骤S4:若所述异常数据的个数不小于所述预置个数,则直接执行步骤S7。
本发明中,所述步骤S3包括:
若所述目标数据集中的日逐时数据符合所述预设条件,则标记所述日逐时数据为异常数据;所述预设条件包括以下条件之一:
所述日逐时数据的能耗值大于第一预设阈值;
所述日逐时数据的能耗数据小于第二预设阈值。
本发明中,所述步骤S7包括:
通过邻近算法选取与所述目标日的日逐时数据最近邻的K日的日逐时数据。
本发明中,所述步骤S9之前包括如下步骤:
确认最近邻的K日的日逐时数据的加权系数;
通过所述加权系数和所述最近邻的K日的日逐时数据获取所述目标日的日逐时模拟数据。
本发明中,所述通过所述加权系数和所述最近邻的K日的日逐时数据获取所述目标日的日逐时模拟数据之前包括:
判断与所述目标日的日逐时数据对应的最近邻的K日的日逐时数据是否为异常数据,若否,则通过所述加权系数和所述最近邻的K日的日逐时数据获取所述目标日的日逐时模拟数据。
本发明中,所述步骤S9包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市建筑科学研究院,未经上海市建筑科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810030170.2/2.html,转载请声明来源钻瓜专利网。