[发明专利]一种基于支持向量机的异常数据检测方法及电子设备在审
申请号: | 202110768842.1 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113420825A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 张源;曲増杰;李硕;张芬芳 | 申请(专利权)人: | 国能龙源蓝天节能技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12;G06N20/00 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 齐胜杰;李会娟 |
地址: | 102200 北京市昌平区七家镇未*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 支持 向量 异常 数据 检测 方法 电子设备 | ||
1.一种基于支持向量机的异常数据检测方法,其特征在于,包括:
S01、获取区域供热运行系统上水时间段内各传感器采集的数据,将所有传感器在每一时间点的数据作为一个待测向量数据;
S02、将每一个待测向量数据和预先训练获取的超球面的向量空间进行比较,判断是否存在处于超球面外部的一个维度以上的数据;所述向量空间的数据维度和待测向量数据的数据维度相同;
S03,若存在,将落在超球面外部的各维度的数据作为检测出的异常数据;
其中,基于区域供热运行系统上一年的数据获取支持向量机的最小支持半径Rv,基于获取的Rv建立超球面的向量空间。
2.根据权利要求1所述的方法,其特征在于,S01之前,所述方法还包括:
M01、获取区域供热运行系统上一年的上水时间段内各传感器采集的数据;
M02、对上一年的数据进行筛选,并标注异常数据标签和正常数据标签,将完成标注的每一时间点的所有传感器的数据作为一个训练数据向量,得到所有训练数据向量组成的训练数据集;
M03、基于所述训练数据集,采用遗传算法优化预设的目标函数,获取支持向量机的最小支持半径Rv。
3.根据权利要求2所述的方法,其特征在于,M03包括:
M03-1、构建具有正则项的目标函数L:
M03-2、基于构建的目标函数L,给目标函数中的正则项v一个随机数,并使拉格朗日乘子α∈PN,且对应的x,获取向量空间的支持半径R;拉格朗日乘子α是一个N维向量;P为实数;
M03-3、采用支持半径R对训练数据集进行分类,获得分类结果的正确率;
重复M03-2至M03-3,直到迭代达到终止条件,则将达到终止条件时对应的正则项v作为最后选定的正则项,同时获得正则项对应的最小支持半径Rv;
其中,x=(x1,x2,…xi,xN)为训练数据集,xi为第i个传感器的训练数据;
定义核函数k(x,y)=φ(x)·φ(y);
N为训练数据集的向量总数,即N个传感器;i、j分别表示从1到N取值,即传感器的编号;φ(xi)为核函数;αi为拉格朗日乘子的第i维向量,用于将约束条件函数与原函数联系到一起,使能配成与变量数量相等的等式方程,以获取原函数极值的各个变量的解,作为非约束优化的目标,基于遗传算法得到解。
4.根据权利要求3所述的方法,其特征在于,所述终止条件为迭代次数达到第一预设阈值;
或者,
终止条件为正确率高于95%~98%。
5.根据权利要求1所述的方法,其特征在于,S01包括:
从云端设备中获取区域供热运行系统上水时间段内各传感器采集的数据;
所述云端设备接收并存储区域供热运行系统中各传感器采集并借助于中继设备上传的数据。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
S04,将检测出的异常数据去除,获得去除异常数据的所有传感器的数据并存储。
7.根据权利要求1所述的方法,其特征在于,所有传感器的数据包括:
压力传感器的数据、温度传感器的数据和/或流量传感器的数据。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
S05、针对去除异常数据的所有传感器的数据,对每一传感器在指定时间内的数据进行降噪处理,并获取降噪的数据;
采用降噪的数据作为输入,采用预先建立的预测模型进行分析或预测,以确定区域供热运行系统的输出或运行是否正常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国能龙源蓝天节能技术有限公司,未经国能龙源蓝天节能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110768842.1/1.html,转载请声明来源钻瓜专利网。