[发明专利]一种基于大数据的电网事故预测方法有效
申请号: | 202010950334.0 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112115180B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 宋士瞻;王传勇;张健;韩蓬;康文文;杨凤文;王坤;王为帅;李森;张建华;侯文;张瑞;仇翠;柳涛;潘明;夏清普 | 申请(专利权)人: | 国网山东省电力公司枣庄供电公司;江苏宏源电气有限责任公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06Q50/06 |
代理公司: | 无锡智麦知识产权代理事务所(普通合伙) 32492 | 代理人: | 王普慧 |
地址: | 277000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 电网 事故 预测 方法 | ||
1.一种基于大数据的电网事故预测方法,其特征在于,包括下述步骤:
步骤1:大数据采集
输入大数据,
步骤2:大数据清洗
去除人为因素造成的电网运行异常,
经过数据清洗的数据矩阵记为S′;
步骤3:大数据归一化
对步骤2得到数据矩阵S′进行归一化;
步骤4:数据分类
计算质心并判断有效性;
步骤5:提取关键信息
根据阈值提取关键信息;
步骤6:新数据预测
用提取的关键信息进行新数据预测;
步骤7:根据分类结果,做提前预处理
根据事件所属类别特点,采取对应的预处理方案;
所述的步骤1包括,
输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S;
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推;
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”;该列用于后续剔除污染数据;
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时或15分钟;
所述的步骤5包括,
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似;将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2;
所述的步骤6包括,
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离;因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断;
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该数据;
所述的步骤4包括
步骤4.1取前5行数据
在数据矩阵S″中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m);
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质);
对于数据矩阵S″中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S″共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数;
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合;
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
……
其中j是集合中元素的个数;
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司枣庄供电公司;江苏宏源电气有限责任公司,未经国网山东省电力公司枣庄供电公司;江苏宏源电气有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010950334.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电网谐波畸变处理方法
- 下一篇:一种新型注塑模具内缩机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置