[发明专利]一种基于特征选择改进的LR‑Bagging算法在审
申请号: | 201610623647.9 | 申请日: | 2016-08-02 |
公开(公告)号: | CN106251241A | 公开(公告)日: | 2016-12-21 |
发明(设计)人: | 吴漾;朱州;谭驰;曾路;王鹏宇;王玮;罗念华;吴忠;张克贤;郭仁超;杨箴;方继宇;龙娜;钱俊凤;王倩冰;陆岫昶 | 申请(专利权)人: | 贵州电网有限责任公司信息中心 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06 |
代理公司: | 贵阳中新专利商标事务所52100 | 代理人: | 李亮 |
地址: | 550001 *** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于特征选择改进的LR‑Bagging算法,包括以下步骤:首先从原始数据中确定初始数据集,要求自变量与因变量的相关程度不能过低;其次,对初始数据集中的离散型自变量进行WEO编码;然后利用随机抽样获得一定数目的记录和特征字段组成训练例,将训练例进行LR((LogisticRegression)模型训练并做系数的正态显著性检验,若不显著,则剔除,反之,加入组合模型。进行循环迭代,直到组合模型较优。最后,则可以采用较优组合模型做预测与分群。该算法可提升分类结果的多样性,变量信息的提取度与预测结果的准确率,也能有效减少基LR模型由于变量过多而导致多重共线与“过拟合”的可能性。 | ||
搜索关键词: | 一种 基于 特征 选择 改进 lr bagging 算法 | ||
【主权项】:
一种基于特征选择改进的LR‑Bagging算法,其特征在于包括以下步骤:步骤1:从原始数据中确定初始数据集,自变量与因变量的相关程度不能过低;步骤2:对离散型自变量进行WEO编码;步骤3:基LR模型的训练与检验,集成组合模型;步骤4:进行步骤三的循环迭代,直到组合模型较优;步骤5:利用较优组合模型的预测与分群。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司信息中心,未经贵州电网有限责任公司信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610623647.9/,转载请声明来源钻瓜专利网。
- 上一篇:基于大数据的输电网络预警方法
- 下一篇:一种风电出力区间组合预测方法