[发明专利]基于参数服务器的梯度提升决策树的实现方法及相关设备有效
申请号: | 201710326930.X | 申请日: | 2017-05-10 |
公开(公告)号: | CN108875955B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 江佳伟;崔斌;肖品 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F9/50 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 参数 服务器 梯度 提升 决策树 实现 方法 相关 设备 | ||
1.一种基于参数服务器的梯度提升决策树的实现方法,其特征在于,包括:
针对每个待处理树节点,根据自身节点的训练数据分别计算各自对应的局部梯度直方图,并将每个局部梯度直方图分成P个分块局部梯度直方图;其中,P个分块局部梯度直方图与P个参数服务器节点一一对应;
通过预设的参数服务器更新梯度直方图的接口,将每个待处理树节点的每个分块局部梯度直方图发送给对应的参数服务器节点;
通过预设的参数服务器获取最佳分裂点的接口,分别向所述P个参数服务器节点发送最佳分裂点获取请求;其中,所述参数服务器包括P个参数服务器节点,每个参数服务器节点各自存储有M/P个特征以及每个特征的梯度直方图,所述M为训练数据的特征数量,所述P为所述参数服务器包括的参数服务器节点的数量;
接收所述P个参数服务器节点分别发送的最佳分裂点的信息,得到P个最佳分裂点的信息;其中所述P个最佳分裂点为所述P个参数服务器节点通过预设的梯度提升决策树GBDT优化算法依次处理各自存储的特征的梯度直方图,计算每个特征作为分裂点时的目标函数增益,从各自存储的M/P个特征中选取目标函数增益最大的特征作为最佳分裂点;
根据所述P个最佳分裂点的信息,比较所述P个最佳分裂点的目标函数增益,并选取目标函数增益最大的分裂点作为全局最佳分裂点。
2.如权利要求1所述的方法,其特征在于,每个最佳分裂点的信息包括分裂特征、分裂特征值以及目标函数增益;
所述选取目标函数增益最大的分裂点作为全局最佳分裂点包括:
将目标函数增益最大的分裂点中的分裂特征和分裂特征值作为全局最佳分裂点。
3.如权利要求1-2任一项所述的方法,其特征在于,所述选取目标函数增益最大的分裂点作为全局最佳分裂点之后,还包括:
将所述全局最佳分裂点发送给所述参数服务器,以使所述参数服务器将所述全局最佳分裂点发送给所有的计算节点。
4.一种基于参数服务器的梯度提升决策树的实现方法,其特征在于,包括:
参数服务器节点通过预设的参数服务器更新梯度直方图的接口,接收计算节点发送的分块局部梯度直方图;其中,所述分块局部梯度直方图为所述计算节点针对每个待处理树节点,根据自身节点的训练数据分别计算各自对应的局部梯度直方图,并将每个局部梯度直方图分成P个分块的局部梯度直方图;且P个分块的局部梯度直方图与P个参数服务器节点一一对应;
所述参数服务器节点将所述分块局部梯度直方图累加到对应的全局梯度直方图上;
参数服务器节点通过预设的参数服务器获取最佳分裂点的接口,接收计算节点发送的最佳分裂点获取请求;
所述参数服务器节点根据所述最佳分裂点获取请求,通过预设的梯度提升决策树GBDT优化算法依次处理各自存储的特征的梯度直方图,计算每个特征作为分裂点时的目标函数增益,从各自存储的特征中选取目标函数增益最大的特征作为最佳分裂点;每个参数服务器节点各自存储有M/P个特征以及每个特征的梯度直方图,所述M为训练数据的特征数量,所述P为所述参数服务器包括的参数服务器节点的数量;
所述参数服务器节点将所述最佳分裂点的信息发送给所述计算节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710326930.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于滚动规划策略的船舶轨迹预测方法
- 下一篇:原生张量处理器