[发明专利]一种基于随机森林的电力用户特征识别分类方法在审
申请号: | 201711260271.0 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108062560A | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 谈竹奎;王冕;李正佳;马春雷;徐长宝;吴金勇;鞠远;刘斌;桂专;袁旭峰;杜雪;汪永祥 | 申请(专利权)人: | 贵州电网有限责任公司电力科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 电力 用户 特征 识别 分类 方法 | ||
1.一种基于随机森林的电力用户特征识别分类方法,其特征在于,包括以下步骤:
根据电力用户的负荷曲线和具体数据,分析不同电力用户用电数据特征,提炼出电力用户用电负荷主要特征;
处理电力用户负荷数据,提取出电力用户负荷数据的主要影响因子,以一定比例划分获取得到随机森林的训练集和测试集;
有放回地从训练集中随机抽取样本,抽取k个样本,每个样本的样本容量和原始训练集一样;
利用决策树算法对k个样本进行训练,获得k个决策树分类模型;
将k个决策树分类模型组成起来,形成组合分类模型,即随机森林分类模型,每个决策树通过投票表决最终分类;
利用测试集对随机森林模型进行分类结果测试,将测试结果和测试集结果进行比较,以此来验证随机森林分类模型;
收集电力用户负荷特性数据,利用该模型对这些数据进行分类;
输出电力用户的分类结果。
2.根据权利要求1所述的基于随机森林的电力用户特征识别分类方法,其特征在于,负荷特征值的提取,电力用户负荷特征有:
①、峰值P
②、峰谷差ΔP
ΔP
③、负荷率k
④、最小负荷系数α。
⑤、耗电量W
3.根据权利要求4所述的基于随机森林的电力用户特征识别分类方法,其特征在于,选择最优化分属性:
“信息熵”是度量样本集合纯度最常用的一种指标,是用来衡量一元模型中信息不确定性的指标,信息的不确定性越大,熵的值也就越大。假的当前样本集合D中第k类样本所占的比例为p
Ent(D)的值越小,则D的纯度越高。
假定离散属性a有V个可能的取值{a
一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升”越大,因此,我们可用信息增益来进行决策树的划分属性选择。
“条件熵”是通过获得更多地信息来消除一元模型中的不确定性,也就是通过二元或者多元模型来降低一元模型的熵。由于只使用一元模型时,只考虑一种事件,这样可能会造成不确定性太大。在二元模型中,我们通过其他事件联合考虑以及不同事件分别考虑的两种概率来降低不确定性。计算条件熵时使用了两种概率,分别是结果与其他所有事件的联合概率P(c),以及结果其他事件分别考虑的条件概率E(c)。条件熵E(T,X)的计算公式如下。条件熵越大,说明二元模型的不确定性越小。
E(T,X)=∑P(c)E(c)
“互信息”是用来衡量信息之间相关性的指标。当这两个信息完全相关时,互信息为1,不相关时,互信息为0,。具体的计算方法就是熵和条件熵之间的差。以下为公式
Gain(T,X)=Entropy(T)-Entropy(T,X)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司电力科学研究院,未经贵州电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711260271.0/1.html,转载请声明来源钻瓜专利网。