[发明专利]分布式决策树训练无效
申请号: | 201110162273.2 | 申请日: | 2011-06-08 |
公开(公告)号: | CN102331992A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | J·肖顿;M-D·布迪尤;A·W·费茨吉本;M·菲诺齐奥;R·E·摩尔;D·罗伯逊 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 黄嵩泉 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及分布式决策树训练。计算机化的决策树训练系统可以包括被配置为接收用于训练决策树的训练数据输入的分布式控制处理单元。系统可以进一步包括多个数据批处理单元,其中每个数据批处理单元被配置为为训练数据的分别的数据批次评估决策树的多个分裂函数中的每一个,从而为每个分裂函数、为数据批次中的每个数据计算部分的直方图。系统可以进一步包括多个节点批处理单元,节点批处理单元被配置为为每个分裂函数聚集相关的部分直方图,以为边缘树节点的子集中的每个节点的每个分裂函数形成聚集的直方图,并且被配置为通过计算为边缘树节点产生最高的信息增益的分裂函数来为每个边缘树节点确定选定的分裂函数。 | ||
搜索关键词: | 分布式 决策树 训练 | ||
【主权项】:
一种计算机化的决策树训练系统(10),所述系统包括:被配置为接收用于训练决策树(16)的训练数据(14)的输入的分布式控制处理单元(50),训练数据(14)包括多个数据单元(18),每个数据单元(18)进一步包括具有相关类标签的至少一个示例数据;多个数据批处理单元(54),每个数据批处理单元(54)被配置为从分布式控制处理单元(50)接收表示训练数据(14)中数据单元(18)的子集的分别的数据批次(64),并且被配置为为分别的数据批次(64)评估决策树(16)的多个分裂函数中的每一个,从而为数据批次(64)中的每个分裂函数和每个数据计算部分直方图(56);以及多个节点批处理单元(58),对于分别的树节点批次(66)中决策树(16)的边缘树节点(48)的每个子集,每个节点批处理单元(58)被配置为聚集每个分裂函数的相关的部分直方图(56)以在子集的每个边缘树节点(48)处为每个分裂函数形成聚集的直方图(60),所述每个节点批处理单元(58)被配置为通过计算为边缘树节点(48)产生最高信息增益的分裂函数来为分别的子集中的每个边缘树节点(48)确定选定的分裂函数;所述分布式控制处理单元(50)进一步被配置为将每个边缘树节点(48)重新分类为包括分别的一个选定的分裂函数的分裂节点(40),以扩展决策树(16)以包括从分裂节点(40)处分支出的新的边缘树节点(48),并且输出决策树(16)用于安装在下游计算设备(24)上。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110162273.2/,转载请声明来源钻瓜专利网。
- 上一篇:燃烧沉降室
- 下一篇:基于电力线通信的智能室内排风系统