[发明专利]基于数据挖掘和支持向量机的配网历史量测数据校正方法在审
申请号: | 201811646621.1 | 申请日: | 2018-12-30 |
公开(公告)号: | CN109783485A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 姜宁;张磐;丁冷允;莫宇;丁一;时燕新;康宁;赵玉新;黄潇潇 | 申请(专利权)人: | 国网天津市电力公司电力科学研究院;国网天津市电力公司;国家电网有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/21 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王来佳 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 量测数据 不良数据 配网 支持向量机 历史数据库 回归模型 数据挖掘 校正 配电自动化系统 读取 离散化处理 关联规则 技术特点 控制决策 配网调度 频繁项集 数据集合 数据校正 无功功率 有功功率 辨识 等量 构建 拟合 主站 剔除 挖掘 智能 记录 安全 | ||
1.一种基于数据挖掘和支持向量机的配网历史量测数据校正方法,其特征在于:包括以下步骤:
步骤1、读取配网主站历史数据库中一段时间内的量测数据记录,并对量测数据基于时间序列进行分类,设置采样周期,将历史数据库中电压、电流、有功功率、无功功率等量测数据进行离散化处理;
步骤2、基于步骤1的预处理的数据,通过Apriori算法,挖掘历史量测数据中频繁项集的强关联规则,在强关联规则的基础上,重新扫描数据库的量测记录,辨识出可疑的不良数据;
步骤3、构建剔除了可疑的不良量测数据的数据集合,基于处理后的数据集合,训练支持向量机的回归模型,将可疑不良数据对应的时刻代入回归模型,计算出拟合值,代替可疑的不良数据,完成数据校正。
2.根据权利要求1所述的一种基于数据挖掘和支持向量机的配网历史量测数据校正方法,其特征在于:所述步骤2的具体步骤包括:
(1)基于预处理的数据,采用Apriori算法进行数据挖掘;
(2)设定初始的支持度support阈值,扫描数据,由计算每条记录的支持度;
其中,I表示总的事务集,如果支持度低于支持度阈值,则排除该事务项,保留的项集作为频繁项集;
(3)由Confidence(X→Y)=P(Y|X)=P(X∪Y)/P(X)计算出频繁项集的置信度,并结合提升度Lift(X→Y)=P(Y|X)/P(Y)判断频繁项集的关联规则是否具有正相关性,如果提升度大于1,则保留正相关性的关联规则,否则,将关联规则丢弃;
(4)结合配网运行的实际原理和组织结构,将不符合实际逻辑的强关联规则剔除,保留合理的强关联规则;
(5)扫描历史数据库,结合强关联规则进行判断,找出不符合强关联规则的数据项,列为可疑的不良数据。
3.根据权利要求1所述的一种基于数据挖掘和支持向量机的配网历史量测数据校正方法,其特征在于:所述步骤3的具体步骤包括:
(1)构建一个剔除了可疑不良数据集的历史量测数据集;
(2)从剔除了可疑不良数据的集合中选取部分数据作为样本,对支持向量机的回归模型进行训练,得到支持向量机的回归模型,用于数据拟合;
(3)基于可疑不良数据对应的时刻,通过支持向量机的回归模型,计算出拟合值,用拟合值代替可疑不良数据,完成数据校正。
4.根据权利要求3所述的一种基于数据挖掘和支持向量机的配网历史量测数据校正方法,其特征在于:所述步骤3第(2)步的具体方法是:
选取部分基于时间序列的量测值{(xi,yi),i=1,2,…,N},作为支持向量机的训练样本;
其中,xi为输入向量,yi为输出向量,SVM(Support Vector Machine)通过f(x)=ω·φ(x)+b进行函数回归估计;
核函数φ(x)可选择可以将原始输入空间映射到新的特征空间,从而使得原本线性不可分的样本在核空间可分;
回归模型优化的目标函数为回归模型的目标是让训练集合中的每个点尽量拟合到线性模型yi=w·φ(xi)+b;
SVM中定义一个常量偏差ε(ε>0),模型输出与真实输出差的绝对值大于ε时计算损失,SVM回归模型的目标函数为:
回归模型对每个样本(xi,yi)引入松弛变量,定义为ξi,则回归模型的损失函数度量在加入松弛变量后变为:
引入拉格朗日乘子将目标优化函数转化为无约束的形式,如下所示:
SVM回归模型的目标函数的原始形式的目标是:
优化目标满足KKT条件,可以通过拉格朗日对偶将优化问题转化为等价的对偶问题来求解:
先求优化函数对w,b,ξi,的极小
值,通过偏导数求得:
将上述关系式代入消去w,b,ξi,得到:
对目标函数求极小值可以得到:
可以用SMO算法求出对应的αi,进而求出回归模型的系统w,b,得到支持向量机的回归模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司电力科学研究院;国网天津市电力公司;国家电网有限公司,未经国网天津市电力公司电力科学研究院;国网天津市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811646621.1/1.html,转载请声明来源钻瓜专利网。