[发明专利]一种基于约束优化的缺失能耗数据填补方法有效
申请号: | 201911062535.0 | 申请日: | 2019-11-03 |
公开(公告)号: | CN111046026B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 卢暾;曾彬;丁向华;张鹏;顾宁 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06Q50/06 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 约束 优化 缺失 能耗 数据 填补 方法 | ||
1.基于约束优化的缺失能耗数据填补方法,其特征在于,利用KNN的思想,使用DTW作为相似性度量,在不等长时间序列集中,提取前K条与存在缺失数据时间序列相似的曲线;然后,通过最小化缺失区间填补值与K条相似曲线的欧式距离,同时以填补值总和等于固定值为约束,将问题转化为连续等式约束优化问题;最终通过拉个朗日乘数法求解,完成填补;
具体步骤如下:
第一步,提取K个相似时间序列:采用DTW时间序列相似性度量,计算出与缺失时间序列前一周和后一周,最相似的K个时间序列,时间粒度为小时,即每小时一个数据点;
第二步,计算数据点占区间总和比例:计算K个时间序列中,每个序列缺失区间所对应的各个数据点,占区间能耗总和的比例;用xkn表示第k个时间序列,缺失区间第n个数据点占区间能耗总和的比例;
第三步,将问题转化为等式约束优化问题:用xmn表示缺失时间序列缺失区间中,第n个待求的缺失数据点占区间数据总和的比例;通过最小化缺失时间序列中,各个缺失数据点比例与K个时间序列对应的数据点比例的欧式距离,同时满足缺失数据点比例总和为1,求得N个待求的缺失数据点占区间能耗总和的比例,具体表达式如下:
最小化问题:
满足
xmn∈(0,1)(3.3)
式中,N表示缺失区间数据点的个数,K表示相似时间序列个数;
第四步,利用拉格朗日乘数法,求解上述等式约束优化问题:定义拉格朗日函数,通过加权,将(3.2)式中的约束引入目标函数(3.1)中:
对上式关于x和λ求偏导,经整理得xmn的表达式:
其中,
2.根据权利要求1所述的缺失能耗数据填补方法,其特征在于,对缺失能耗数据进行填补前,对缺失区间进行建模,缺失区间的定义如下:
GapID,AnalogNo,StartTime,EndTime,Lvalue,Rvalue,Status
ID为缺失区间的唯一标识,AnalogNo是模拟量编号,即测点编号,StartTime是缺失区间的起始时间,EndTime是缺失区间的结束时间,Lvalue是缺失区间的左边界电表读数,Rvalue是缺失区间的右边界电表读数,Status是缺失区间的填补状态,记录当前区间是否被填补过;将Rvalue和Lvalue进行相减就可以得到该缺失区间时间段内的能耗值。
3.根据权利要求1或2所述的缺失能耗数据填补方法,其特征在于,设计缺失能耗区间填补工具系统,系统分为三层:定时器、缓存和数据库;其中:
(1)定时器,包括检测定时器和填补定时器;检测定时器创建两个线程,一个用于预处理前三周能耗数据,另一个线程用于检测近24小时的缺失区间,以及缓存近24小时的能耗数据;填补定时器定时每周对上一周缺失数据进行填补,填补的前提是前三周能耗数据已经预处理完成,且当前没有在进行填补,若当前已经正在填补,一分钟之后重新进行填补条件判断;
(2)缓存,将填补时需要的部分数据,缓存到内存;根据算法需要,缓存所有测点近三周的小时能耗数据,以及测点间的拓扑结构;
(3)数据库,主要用于存储历史能耗数据、缺失区间的填补状态和填补数据;数据库中有四张表:历史小时表、小时数据表、填补状态表、填补数据表;历史小时表存储每个测点的历史每个时间点的电表读数,小时数据表存储每个测点当前小时的电表读数,填补状态表存储每个测点各个缺失时间区间的填补状态,填补数据表存储填补之后每个测点各个时间点的电表读数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911062535.0/1.html,转载请声明来源钻瓜专利网。