[发明专利]一种小样本驱动的异常用电数据集的构建方法及模块在审
申请号: | 202110424608.7 | 申请日: | 2021-04-20 |
公开(公告)号: | CN113190595A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 周玉;邵雪松;李悦;穆卓文;黄奇峰;蔡奇新;易永仙;高凡;陈飞 | 申请(专利权)人: | 国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06Q50/06 |
代理公司: | 北京智绘未来专利代理事务所(普通合伙) 11689 | 代理人: | 王萍;肖继军 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 驱动 异常 用电 数据 构建 方法 模块 | ||
1.一种小样本驱动的异常用电数据集的构建方法,其特征在于,包括以下步骤:
步骤1,采集低压居民用户的用电数据,对所述用电数据进行处理并生成分类数据集;
步骤2,采用蒙特卡洛方法对所述分类数据集进行概率密度拟合,并基于概率密度函数构建随机样本,以及基于所述随机样本生成正常用电行为数据集;
步骤3,基于用户的异常用电行为构建异常用电数据篡改模型,并基于所述异常用电数据篡改模型和所述正常用电行为数据集生成异常用电行为数据集;
步骤4,合并所述正常用电行为数据集与所述异常用电行为数据集,以生成用电行为数据集。
2.根据权利要求1中一种小样本驱动的异常用电数据集的构建方法,其特征在于:
所述分类数据集的构建方法为:
步骤1.1,对所述低压居民用户的智能电表中用电数据进行采集和预处理,并基于预处理后的数据生成样本数据集;
步骤1.2,基于用户用电的周期特性和数值特性生成样本数据集判据,并基于所述样本数据集判据建立分类数据集;
步骤1.3,对分类数据集中的数据分别进行聚类,并基于聚类结果剔除所述分类数据集中的异常样本。
3.根据权利要求2中所述的一种小样本驱动的异常用电数据集的构建方法,其特征在于:
对所述低压居民用户的智能电表中用电数据进行预处理还包括:
去除采集到的原始数据中的异常值和离群值样本,同时采用插值法填充原始数据中的缺失值。
4.根据权利要求2中所述的一种小样本驱动的异常用电数据集的构建方法,其特征在于:
所述样本数据集判据包括周期特性判据和数值特性判据;
其中,所述周期特性判据用于将所述样本数据集中的样本数据区分为工作日数据和非工作日数据,所述数值特性判据区分所述样本数据和基于所述样本数据生成的标准化数据;
所述分类数据集包括工作日样本数据集、非工作日样本数据集、工作日标准数据集、非工作日标准数据集。
5.根据权利要求2中所述的一种小样本驱动的异常用电数据集的构建方法,其特征在于:
采用聚类算法对每一分类数据集进行聚类,从聚类结果中筛选距离中心曲线最远的5%的样本,将所述样本作为异常样本剔除;
其中,所述聚类算法的聚类数是以所述轮廓系数作为评价指标确定的。
6.根据权利要求1中所述的一种小样本驱动的异常用电数据集的构建方法,其特征在于:
所述步骤2中采用蒙特卡洛方法对所述分类数据集进行概率密度拟合并基于概率密度函数构建随机样本还包括:
步骤2.1,采用主成分分析法对每一分类数据集中的所有样本数据进行原始维度解耦和维度转换,以基于新的维度生成数据组;
步骤2.2,对每一数据组进行概率密度拟合,并基于概率密度函数构建当前数据组所在维度下的随机数据;
步骤2.3,对所有维度执行步骤2.2,并合成所有维度下的随机数据为多维数据样本;
步骤2.4,对所述多维数据样本进行维度解耦反变换,以获得原始维度下的随机样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司,未经国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110424608.7/1.html,转载请声明来源钻瓜专利网。