[发明专利]构建GBDT模型的方法、装置及预测方法、装置有效
申请号: | 201910526406.6 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110348580B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 王海;涂威威 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;曾世骁 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了构建梯度提升决策树GBDT模型的方法及装置,涉及机器学习技术领域,主要目的在于解决现有的所训练的决策树模型的准确率较低的问题。本发明主要的技术方案为:获取样本数据集,所述样本数据集中包括带正标签的正样本数据及无标签的未标记样本数据;在训练GBDT模型的每一棵回归树时,基于所述样本数据集中的正样本数据构建一个正样本训练子集,对所述样本数据集中的未标记样本数据进行采样构建一个负样本训练子集,将所述正样本训练子集与所述多个负样本训练子集进行组合得到当前回归树的训练集,并基于所述当前回归树的训练集训练当前回归树,再根据所述每一颗回归树构建梯度提升决策树GBDT模型。本发明用于对梯度提升决策树的构建过程中。 | ||
搜索关键词: | 构建 gbdt 模型 方法 装置 预测 | ||
【主权项】:
1.一种构建梯度提升决策树GBDT模型的方法,包括:获取样本数据集,所述样本数据集中包括带正标签的正样本数据及无标签的未标记样本数据;在训练GBDT模型的每一棵回归树时,基于所述样本数据集中的正样本数据构建一个正样本训练子集,对所述样本数据集中的未标记样本数据进行采样构建一个负样本训练子集,将所述正样本训练子集与所述多个负样本训练子集进行组合得到当前回归树的训练集,并基于所述当前回归树的训练集训练当前回归树,再根据所述每一颗回归树构建梯度提升决策树GBDT模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910526406.6/,转载请声明来源钻瓜专利网。