[发明专利]提高梯度提升树模型的特征值作用和防止过拟合的方法在审
申请号: | 201910274219.3 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110232448A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 杨萃;黄晓鸿 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了提高梯度提升树模型的特征值作用和防止过拟合的方法。本发明通过将离散化前特征值添加到损失函数中,最终得到最佳分裂点及特征值权重和偏置,进一步尽可能多地利用离散化前的数据。对于输入特征与输出目标相关性较强的数据,模型表现性能相对于梯度提升树有较大的提升;本发明还给出了一种t分布防止过拟合方式,通过大数定理筛选分裂点,在实际应用中可以通过该方式找到更加准确的分裂点,防止过拟合。本发明解决了梯度决策树模型只考虑特征值离散化后的大小,而不会考虑离散化前特征值数值的真实分布以及过拟合问题。本发明可广泛应用于广告预测、人工智能、图像识别、语音识别等各个方面。 | ||
搜索关键词: | 拟合 离散化 分裂点 树模型 决策树模型 人工智能 大数定理 输出目标 输入特征 损失函数 图像识别 语音识别 真实分布 权重和 偏置 应用 筛选 预测 广告 表现 | ||
【主权项】:
1.提高梯度提升树模型的特征值作用和防止过拟合的方法,其特征在于包括以下步骤:步骤1:对样本集D确定梯度提升树模型的输入特征xij和输出变量yi,其中i表示第i个样本,j表示第j个特征,样本个数为n,特征值个数为m;定义损失函数;步骤2:对特征值xij进行归一化;步骤3:对预测值
初始化为yi的平均值
步骤4:对特征值xij离散化得出所有的分裂点,分裂点个数为s;步骤5:计算输入样本的一阶偏导gi和二阶偏导hi;步骤6:在第k个叶子节点上,对于每一个分裂点,该叶子节点的样本Dk会预分裂为左样本L和右样本R,其中L+R=Dk,如果k为0,则D0=D;遍历所有分裂点,计算左样本L和右样本R的所有特征值的特征值权重w1、特征值偏置w2及对应的分裂增益gain;此时会得到s份左样本L和右样本R,s×m个特征值权重w1、特征值偏置w2及对应的分裂增益gain;步骤7:如果用户定义的损失函数为MSE函数,即
则执行t分布防止过拟合方式,如果用户定义的损失函数不是
则直接执行步骤8;步骤8:从s×m个gain中找出最大的gain,及对应的分裂点、特征值权重w1、特征值偏置w2、特征值权重w1和特征值偏置w2对应的选定特征r,但暂时不分裂;步骤9:从所有的节点中找出gain最大的节点,对该节点进行分裂;步骤10:对新分裂出来的两个节点重复步骤6~10,直到叶子节点个数大于用户指定的叶子节点个数;至此构建完毕一棵弱决策树;步骤11:对数据集根据该决策树上非叶子节点上的分裂点将数据分裂到各个叶子节点上;步骤12:对各叶子节点上的数据,更新预测值:第t棵弱决策树的预测值
其中η为学习率,i为第i个样本,k为第k个叶子节点,r为第r个特征,t为第t棵弱决策树;步骤13:重复5~13,直至弱决策树棵数达到用户给定的弱决策树总数或验证集准确率不再提升。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910274219.3/,转载请声明来源钻瓜专利网。
- 上一篇:法律案件深度推理方法
- 下一篇:一种收费站机电设备的智能运维系统及方法