[发明专利]用于电网业务大数据检测分析的聚类方法及装置在审
申请号: | 202011135966.8 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112396090A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 郑伟彦;陈蕾;夏晓春;黄雨;童力;余慧华;刘宏伟;孙国锋;吴靖;刘兴业 | 申请(专利权)人: | 国网浙江省电力有限公司杭州供电公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/20;G06Q50/06 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 电网 业务 数据 检测 分析 方法 装置 | ||
本申请实施例提出了用于电网业务大数据检测分析的聚类方法及装置,包括在电网大数据平台处通过核心路由节点收集包括发送方IP地址、接收方IP地址、发送时间在内的全网数据包;解析全网数据包得到对应每个发送方IP地址发送数据包的数量以及每个接收方IP地址接收数据包的数量,基于得到的数量进行统计得到针对未知IP地址的未知数据集;根据已知数据集确定中心点;计算未知数据集中的每个点与中心点的最短距离,对未知数据集的点执行聚类操作。利用大数据对全网数据进行处理,将已知的异常数据发送方IP地址作为重要训练样本;最密集的区域是最有可能出现潜在风险点,作为起始中心点,能够指引后续的聚类;并借助抛弃边缘点的做法提高了聚类效率。
技术领域
本申请属于大数据作业领域,尤其涉及用于电网业务大数据检测分析的聚类方法及装置。
背景技术
电力系统向高度信息化、自动化的方向发展,电网规模的日益扩大,需要管理庞大的电力设备设施数据、电网业务数据、用户数据、规划数据等。而科学的决策在某种程度上依赖于决策者所掌握的信息量的大小。发电变电、电网系统均是包含大量信息的复杂系统。而现有技术将有关信息集成起来,为电力系统决策人员提供一个多元化的决策依据。
目前电网存在多源异构海量数据,包括已有实时数据、历史数据和方针数据等多源异构数据,这些数据之间存在整合的多样性和不确定性的问题,而且在各类数据中往往还混杂有异常数据,这些异常数据有些还可能是具有主观恶意的异常数据。
现有技术中,还是在利用传统的聚类算法,将所有要聚类的点都一视同仁,从而导致算法的计算量特别大,计算成本大,计算速度低。
要解决的问题是:如何降低要聚类的点的数量,实现对聚类算法的降维处理,能够快速清理异常数据。
发明内容
为了解决现有技术中存在的缺点和不足,本申请提出了用于电网业务大数据检测分析的聚类方法及装置,借助聚类过程中抛弃边缘点的做法,提高了聚类效率。
具体的,一方面,本申请实施例提出的用于电网业务大数据检测分析的聚类方法,包括:
在电网大数据平台处通过核心路由节点收集包括发送方IP地址、接收方IP地址、发送时间在内的全网数据包;
解析全网数据包得到对应每个发送方IP地址发送数据包的数量以及每个接收方IP地址接收数据包的数量,基于得到的数量进行统计得到针对未知IP地址的未知数据集;
根据已知数据集确定中心点;
计算未知数据集中的每个点与中心点的最短距离,对未知数据集的点执行聚类操作。
可选的,所述解析全网数据包得到对应每个发送方IP地址发送数据包的数量以及每个接收方IP地址接收数据包的数量,基于得到的数量进行统计得到针对未知IP地址的未知数据集,包括:
统计每个IP地址发送数据包的数量以及接收方IP地址获得两个数据;
其中,第一数据是数据发送频率的变化程度,第二数据是接收方数量的变化程度,将第一数据作为x轴参数,第二数据作为y轴参数,每个IP地址相当于二维坐标里的一个点。
根据电网历史数据,确定属于已知的异常数据发送方的IP地址,结合已知的全部IP地址筛选出未知IP地址;
建立针对所有已知的异常数据发送方IP地址的已知数据集,建立针对所有未知IP地址的未知数据集。
可选的,所述根据已知数据集确定中心点包括:
预先设置分类数量k,所述分类数量历史数据的数量正相关,或与当前一段时间内的数据数量正相关;
找出已知数据集中x轴的最大值和最小值,并将从最小值到最大值均分为k个区间,每个区间的间隔是xl;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司杭州供电公司,未经国网浙江省电力有限公司杭州供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011135966.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:计算机销售展示架
- 下一篇:一种防止针剂撞击的贮存柜
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置