[发明专利]决策树模型的训练方法、系统、存储介质及预测方法在审
申请号: | 201910944121.4 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110728317A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 江佳伟;符芳诚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 树节点 子处理 决策树模型 梯度数据 特征集 主处理 分裂 机器学习技术 人工智能技术 人工智能 处理节点 存储介质 降低系统 节点确定 训练过程 资源开销 数据量 并发 传输 预测 申请 | ||
1.一种决策树模型的训练方法,其特征在于,包括:
每个子处理节点分别针对当前训练的树节点,获取所述当前训练的树节点的节点训练特征集和梯度数据,其中,所述梯度数据为所述决策树模型的特征矩阵的梯度数据,所述节点训练特征集是之前已训练的树节点的分裂规则和子处理节点的特征子集确定的,所述特征子集中包含多个特征列Tj,特征列Tj中包含所有样本的特征j的特征值,所述子处理节点包括N个,N个子处理节点各自的特征子集组成所述特征矩阵,且N个子处理节点的特征子集互不相交;
每个子处理节点分别针对当前训练的树节点,根据获取的节点训练特征集和梯度数据确定出局部最佳分裂规则并发送给主处理节点,所述局部最佳分裂规则包括使目标函数的增益最大的特征和特征值;
所述主处理节点从每个子处理节点确定出的局部最佳分裂规则中,选出所述当前训练的树节点对应的分裂规则。
2.根据权利要求1所述的方法,其特征在于,所述每个子处理节点分别针对当前训练的树节点,获取所述当前训练的树节点的节点训练特征集和梯度数据之前,还包括:
每个子处理节点分别获取本子处理节点的特征子集和梯度数据;
每个子处理节点分别针对根节点,根据获取的特征子集和梯度数据确定出所述根节点的局部最佳分裂规则并发送给所述主处理节点;
所述主处理节点从每个子处理节点确定出的所述根节点的局部最佳分裂规则中,选出所述根节点对应的分裂规则,并将所述根节点对应的分裂规则发送给各个子处理节点。
3.根据权利要求2所述的方法,其特征在于,所述每个子处理节点分别获取本子处理节点的特征子集和梯度数据中,每个子处理节点获取本子处理节点的特征子集,具体包括:
从所述特征矩阵中获取与本子处理节点对应的指定行数的数据,所述特征矩阵中第i行第j列存储的是第i个样本的特征j对应的特征值;
按预设切分方式,将获取的指定行数的数据按列切分为N个子特征矩阵;
保留本子处理节点的子特征矩阵,并将N-1个子特征矩阵分别发送给对应的其他子处理节点;
接收其他N-1个子处理节点发送给本子处理节点的子特征矩阵;
合并本子处理节点对应的所有子特征矩阵,得到本子处理节点的特征子集。
4.根据权利要求1至3任一所述的方法,其特征在于,通过如下方式确定每个子处理节点的所述当前训练的树节点的节点训练特征集:
所述主处理节点将所述当前训练的树节点对应的父节点的分裂规则发送给父子处理节点,所述父子处理节点为所述父节点的分裂规则中的特征所对应的子处理节点;
所述父子处理节点根据所述父节点的分裂规则,将所述父子处理节点对应的所述父节点的节点训练特征集中包含的样本划分到所述父节点的两个子节点上,得到所述父节点的分裂结果并发送给其他子处理节点;
每个其他子处理节点分别根据所述父节点的分裂结果,确定被划分到所述当前训练的树节点上的样本,从子处理节点的特征子集中获取所述被划分到所述当前训练的树节点上的样本对应的特征列,得到所述当前训练的树节点的节点训练特征集。
5.根据权利要求4所述的方法,其特征在于,在将所述父节点的分裂结果并发送给其他子处理节点之前,还包括:
采用二进制编码的方式对所述父节点的分裂结果进行压缩编码处理。
6.根据权利要求1至3任一所述的方法,其特征在于,所述根据获取的节点训练特征集和梯度数据确定出局部最佳分裂规则,具体包括:
获取所述当前训练的树节点的节点训练特征集中每个特征对应的梯度直方图,所述梯度直方图的横轴为候选特征值,所述梯度直方图的纵轴为特征值在相邻两个候选特征值之间的样本的梯度数据之和;
分别针对每个特征对应的每个候选特征值,以该候选分征值为分裂点,将该特征对应的梯度直方图划分成左梯度直方图和右梯度直方图,根据所述左梯度直方图的梯度数据之和所述右梯度直方图的梯度数据之和,确定该候选特征值对目标函数的增益;
取使所述目标函数的增益最大的特征和候选特征值,确定为局部最佳分裂规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910944121.4/1.html,转载请声明来源钻瓜专利网。