[发明专利]一种基于异常值检测和抽样技术的10kV配变低压跳闸预测方法在审
申请号: | 201910232352.2 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110135614A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 孟安波;刘哲;许锐埼;邵慧栋 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杜鹏飞;杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 跳闸 预测 验证集 异常值检测 抽样技术 训练样本 训练集 台区 过载预测 历史数据 特征变量 预测目标 变负荷 测试集 滑窗法 准确率 清洗 覆盖率 | ||
1.一种基于异常值检测和抽样技术的10kV配变低压跳闸预测方法,其特征在于,包括下述步骤:
步骤一,获取关于公变台区低压跳闸的特征变量数据,并对数据进行清洗和整理;
步骤二,数据划分;明确预测月份,预测月份称为测试集,将预测月份前的历史数据作为训练样本,采用滑窗法将训练样本划分为训练集和验证集,验证集一般选定为目标月份的前三个月数据,训练集为验证集前一年的数据;
步骤三,每次训练模型前,采用Isolation Forest隔离森林算法对训练集数据中少数类样本进行离群值检测,从而保证经过抽样步骤所参照的原始数据质量;
步骤四,对于训练集中剔除离群值后的少数类样本,采用SMOTE-NC过抽样算法进行合成新的少数类样本,直至设置的样本数目达到预设的少数类和多数类样本比例,从而解决训练集中数据不平衡问题;
步骤五,使用获取的新训练集配合不同的参数组合进行模型训练,并输入验证集特征变量,预测出验证集周期内的每日跳闸概率;
步骤六,以配变在验证集所在标准月内最高的日跳闸概率作为该配变在该标准月的跳闸概率,然后以月度为评价周期,使用ROC曲线面积—AUC,进行模型评价,选取出验证集AUC平均评价最高的一组参数组合;
步骤七,优化后的参数组合和预测目标月份前一年的历史数据作为新的输入,重复离群值剔除和重抽样过程,模型训练完毕;输入预测目标月份每日的特征变量,得出预测目标月份每日的跳闸概率值,其中各配变日最高跳闸概率为配变在该标准月的跳闸概率。
2.根据权利要求1所述的基于异常值检测和抽样技术的10kV配变低压跳闸预测方法,其特征在于,所述Isolation Forest隔离森林算法是基于隔离的思想,在原始样本数据中抽样ψ个子样本,并随机选择一个样本属性及隔离值将子样本空间进行递归地划分;隔离的过程可以描述成一个建立树结构的过程,直至每个数据对象都由一颗命名为iTree的二叉树与其它对象区别开来;对于一个样本,建立的隔离树求其分割的路径长度h(x),路径长度h(x)越小,即离树的根节点较近,表示该数据越容易被隔离,也就意味着需少量划分次数即可将异常对象与其它对象区别。
3.根据权利要求2所述的基于异常值检测和抽样技术的10kV配变低压跳闸预测方法,其特征在于,所述隔离树iTree具体为:令T为隔离树上的一个节点,则T要么是没有子节点的外部节点,要么是包含两个子节点(Ti和Tr)内部节点,其中Tl和Tr分别是其左、右子节点;针对一个样本集X={x1,x2,L xn},为了构建隔离树,采用递归地选择一个隔离属性q和一个隔离值p的方法,对每一个数据对象xi,计算其属性值q(xi),如果q(xi)<p,则放在左子隔离树,反之则放在右子隔离树;每颗隔离树直至满足下列预设条件时构建结束:(1)树达到高度限制;(2)样本集X中只剩下一个数据点,无法继续分割;按照上述过程构建了设定数目t个隔离树之后组成隔离森林iForest,训练过程结束。
4.根据权利要求2所述的基于异常值检测和抽样技术的10kV配变低压跳闸预测方法,其特征在于,所述路径长度h(x)具体为:对于一个数据对象,将其从根节点到被隔离的叶子节点之间树的高度定义为路径长度h(x);由于隔离树与二叉搜索树(BST)有等效的结构,因此数据对象的叶节点路径长度等于二叉搜索树(BST)中搜索失败时的路径长度;二叉搜索树(BST)中搜索失败时的路径长度计算公式如下:
c(n)=2H(n-1)-(2(n-1)/n) (1)
H(i)=ln(i)+γ (2)
上式中,H(i)是谐波数;γ是欧拉常数,值为0.5772156649;
根据c(n)是给定n时路径长度h(x)的长度,可将其用于标准化h(x),计算出每个待测数据的异常分数,公式为:
上式中,E(h(x))为设定数目t个隔离树中h(x)的平均值。
5.根据权利要求1所述的基于异常值检测和抽样技术的10kV配变低压跳闸预测方法,其特征在于,所述SMOTE-NC过抽样算法具体为:SMOTE-NC过抽样算法是基于经典SMOTE过抽样算法的一种改进算法;采用SMOTE算法对少数类样本进行过抽样,合成样本Xnew计算方式如下:
上式中,rand(0,1)表示区间(0,1)的一个随机数,x为任意少数类样本,为x的k个最邻近样本中的随机一个,本发明中,k默认设置为5,过抽样数目为N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910232352.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理