[发明专利]一种基于对数区间隔离的电力调度数据异常检测方法有效
申请号: | 202011148000.8 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112181706B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 高欣;王锋;贾欣;李康生;查森;任昺;纪维佳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06N3/006 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对数 区间 隔离 电力 调度 数据 异常 检测 方法 | ||
1.一种基于对数区间隔离的电力调度数据异常检测方法,其特征在于,所述方法步骤包括:
(1)通过Bagging技术获得正常样本数据的多个子集;
(2)计算每个子集空间下每个子样本对于该子样本所属子集空间的马氏距离,然后根据样本马氏距离对子集空间中每个子样本进行对数区间隔离;
(3)根据区间内样本数量对样本进行二叉划分,根据样本马氏距离所在区间均匀划分为log2N个子区间,把含有样本量最少的区间内的样本集划分到右子树节点,其余样本集划分至左子树节点,在左右子树节点的数据集上重复上面的过程,直接达到终止条件;
(4)构建多个对数区间隔离子树,组成对数区间隔离森林异常检测器,求出每个样本在每个子树下的路径长度,集成每个子树中对应数据的路径长度并取平均值求得异常分数,根据异常率阈值筛选出数据集中的异常样本;
(5)通过构建好的对数区间隔离森林异常检测器离线模型判断数据的异常情况。
2.根据权利要求1所述的方法,其特征在于,通过Bagging技术获得正常样本数据的多个子集,具体为:基于原始电力调度数据集,采集N条电力调度数据样本,组成原始电力调度数据集X;运用Bagging技术对原始数据集X进行t次均匀、有放回的抽样,其中t∈[20,120],每次抽出ψ条样本数据,产生t组子样本X'1~X't,作为隔离树的训练样本集,其中,ψ∈[60,1024],t∈[20,120],每个子样本集X'i含有ψ个样本X'i={x1,x2,...,xψ},ψ为小于训练数据集X大小的正整数,可根据实际情况选择合适数值,每个样本点含有n个维度,即第i个样本
3.根据权利要求1所述的方法,其特征在于,计算每个子集空间下每个子样本对于该子样本所属子集空间的马氏距离,然后根据样本马氏距离对子集空间中每个子样本进行对数区间隔离,具体为:计算每个子集空间下每个子样本对于该空间的马氏距离DM(xi,X'):
其中,μ为该子集X'下的中心点,xi为子集X'下的第i个样本点,∑为子集X'的协方差矩阵;
对每个样本的马氏距离排序,按照样本马氏距离的最大值max和最小值min界定区间[min,max],将区间平均分割为log2(|X'|)个子区间,其中|X'|为子集X'的样本个数。
4.根据权利要求1所述的方法,其特征在于,根据区间内样本数量对样本进行二叉划分,根据样本马氏距离所在区间均匀划分为log2N个子区间,把含有样本量最少的区间内的样本集划分到右子树节点,其余样本集划分至左子树节点,在左右子树节点的数据集上重复上面的过程,直接达到终止条件,具体为:统计每个子区间里样本的数量,基于数据分布,将样本数量最少的子区间里的样本划分到右子树节点,其余样本划分到左子树节点,分别在左右子树节点两边的数据集上重复上面的过程,直至达到终止条件,终止条件有两个:
1)数据集本身不可再分,即只包括一个样本,或者全部样本相同;
2)树的高度达到log2(ψ)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011148000.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节能环保生物转盘的自转机构
- 下一篇:一种岩棉纤维节能保温系统