[发明专利]一种基于随机森林的电力用户特征识别分类方法在审

申请号：	201711260271.0	申请日：	2017-12-04
公开（公告）号：	CN108062560A	公开（公告）日：	2018-05-22
发明（设计）人：	谈竹奎;王冕;李正佳;马春雷;徐长宝;吴金勇;鞠远;刘斌;桂专;袁旭峰;杜雪;汪永祥	申请（专利权）人：	贵州电网有限责任公司电力科学研究院
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	550002 贵***	国省代码：	贵州;52
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于随机森林电力用户特征识别分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于随机森林的电力用户特征识别分类方法，其特征在于，包括以下步骤：

根据电力用户的负荷曲线和具体数据，分析不同电力用户用电数据特征，提炼出电力用户用电负荷主要特征；

处理电力用户负荷数据，提取出电力用户负荷数据的主要影响因子，以一定比例划分获取得到随机森林的训练集和测试集；

有放回地从训练集中随机抽取样本，抽取k个样本，每个样本的样本容量和原始训练集一样；

利用决策树算法对k个样本进行训练，获得k个决策树分类模型；

将k个决策树分类模型组成起来，形成组合分类模型，即随机森林分类模型，每个决策树通过投票表决最终分类；

利用测试集对随机森林模型进行分类结果测试，将测试结果和测试集结果进行比较，以此来验证随机森林分类模型；

收集电力用户负荷特性数据，利用该模型对这些数据进行分类；

输出电力用户的分类结果。

2.根据权利要求1所述的基于随机森林的电力用户特征识别分类方法，其特征在于，负荷特征值的提取，电力用户负荷特征有：

①、峰值Pmax。取电力用户日用电曲线中的最大值来作为该电力用户用电负荷曲线的峰值——日最大负荷Pmax，一般工业用户用电峰值相对于家庭用户或者商业用户来说偏大；

②、峰谷差ΔPm。取电力用户用电曲线中的最大值Pmax和最小值Pmin，两者的差值作为该电力用户用电曲线的峰谷值

ΔPm＝Pmax-Pmin

③、负荷率km。

④、最小负荷系数α。

⑤、耗电量Wd。一般工业负荷的耗电量比一般家庭大得多

3.根据权利要求4所述的基于随机森林的电力用户特征识别分类方法，其特征在于，选择最优化分属性：

“信息熵”是度量样本集合纯度最常用的一种指标，是用来衡量一元模型中信息不确定性的指标，信息的不确定性越大，熵的值也就越大。假的当前样本集合D中第k类样本所占的比例为pk(k＝1,2……,|y|)，则D的信息熵定义为

E n t ( D ) = - Σ | y | p k log 2 p k - - - ( 1 ) ]]>

Ent(D)的值越小，则D的纯度越高。

假定离散属性a有V个可能的取值{a1，a2，….aV}若使用a来对样本集D进行划分，则会产生V个分支结点，其中第v个分支结点包含了D中所有在属性a上取值为aV的样本，记为DV。我们可以根据式(1)计算出DV的信息熵，再考虑到不同的分支结点所包含的样本数不同，给分支结点赋予权重|DV|/|D|，即样本数越多的分支结点的影响越大，于是可计算出用属性a对样本集D进行划分所获得的“信息增益”

G a i n ( D , a ) = E n t ( D ) - Σ v = 1 V | D v | | D | E n t ( D v ) - - - ( 2 ) ]]>

一般而言，信息增益越大，则意味着使用属性a来进行划分所获得的“纯度提升”越大，因此，我们可用信息增益来进行决策树的划分属性选择。

“条件熵”是通过获得更多地信息来消除一元模型中的不确定性，也就是通过二元或者多元模型来降低一元模型的熵。由于只使用一元模型时，只考虑一种事件，这样可能会造成不确定性太大。在二元模型中，我们通过其他事件联合考虑以及不同事件分别考虑的两种概率来降低不确定性。计算条件熵时使用了两种概率，分别是结果与其他所有事件的联合概率P(c)，以及结果其他事件分别考虑的条件概率E(c)。条件熵E(T,X)的计算公式如下。条件熵越大，说明二元模型的不确定性越小。

E(T,X)＝∑P(c)E(c)

“互信息”是用来衡量信息之间相关性的指标。当这两个信息完全相关时，互信息为1，不相关时，互信息为0,。具体的计算方法就是熵和条件熵之间的差。以下为公式

Gain(T,X)＝Entropy(T)-Entropy(T,X)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司电力科学研究院，未经贵州电网有限责任公司电力科学研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711260271.0/1.html，转载请声明来源钻瓜专利网。

上一篇：适用于水刀砂管的硬质合金及其制备方法
下一篇：一种具有吸附铁屑的便携式验针器

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于随机森林的电力用户特征识别分类方法在审

专利文献下载