[发明专利]一种极值梯度提升逻辑回归分类预测方法在审
申请号: | 201811238800.1 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109409426A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 陈金香;范谨麒;张云贵 | 申请(专利权)人: | 冶金自动化研究设计院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京华谊知识产权代理有限公司 11207 | 代理人: | 刘月娥 |
地址: | 100071 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种极值梯度提升逻辑回归分类预测方法,属于大数据分析与智能分类预测领域。通过对样本使用极值梯度提升模型学习之后,将各个样本落在每颗分类与回归树的叶子节点位置进行独热编码组合成新的特征,再与之前的特征结合起来形成组合特征,使得样本的特征增多,组成新的样本。采用逻辑回归法对新样本进行分类预测。融合极值梯度提升与逻辑回归方法;利用极值梯度提升进行特征选择,选择cart树作为基分类器,利用基尼不纯度构成一系列的不相关特征,扩大了特征的维数,将新的特征输入到逻辑回归模型中训练会有更好的预测效果。优点在于,分别利用了极值梯度提升的特征选择和特征扩充的功能,解决了单模型逻辑回归模型预测精度低的问题。 | ||
搜索关键词: | 预测 样本 逻辑回归 逻辑回归模型 特征选择 分类 分类与回归树 基分类器 模型学习 特征结合 特征输入 叶子节点 智能分类 组合成新 组合特征 大数据 单模型 热编码 新样本 与逻辑 基尼 维数 融合 回归 分析 | ||
【主权项】:
1.一种极值梯度提升逻辑回归分类预测方法,其特征在于,具体步骤如下:步骤1、将所有样本放入极值梯度提升模型中进行训练,极值梯度提升是由一系列分类与回归树集成的,统计每个样本落在每棵分类与回归树树叶子节点的位置,对于每棵树,对该位置记为1,其余叶子节点记为0,即独热编码;假设有n棵树,每棵树深度为m,则每个样本增加的特征数为:n*2m‑1;步骤2、将步骤1中的特征数据通过极值梯度提升计算每个特征的重要程度;重要程度计算如下:对于每个特征,计算极值梯度提升中所有分类与回归树树每个分支是否选择该特征的总和;这样得到每个特征的重要系数,将重要系数比较低的特征去掉,留下对结果影响相对比较大的特征,提高后续的预测准确率;步骤3、将步骤2中得到的新的数据集输入到逻辑回归模型中,该模型是在线性模型的基础上通过Sigmoid函数将输入函数值映射到0到1区间,作为各类判别的概率;当是多分类问题,采用Softmax函数取每个类别的概率,概率大的类别为预测结果类别;其中Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线;将变量映射到0,1之间;Softmax函数是一种归一化指数函数,是逻辑函数的一种推广;步骤4、模型的评估。对于二分类问题,采用如下评估方法:准确率:召回率:F1值:其中,TP为真正例,描述真实类别为正例,预测类别为正例;FP为假正例,描述真实类别为负例,预测类别为正例;FN为假负例,描述真实类别为正例,预测类别为负例;TN为真负例,描述真实类别为负例,预测类别为负例。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冶金自动化研究设计院,未经冶金自动化研究设计院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811238800.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于近邻成分分析的故障类型识别方法
- 下一篇:一种按键检测方法及装置