[发明专利]分布式决策树训练无效
申请号: | 201110162273.2 | 申请日: | 2011-06-08 |
公开(公告)号: | CN102331992A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | J·肖顿;M-D·布迪尤;A·W·费茨吉本;M·菲诺齐奥;R·E·摩尔;D·罗伯逊 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 黄嵩泉 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 决策树 训练 | ||
1.一种计算机化的决策树训练系统(10),所述系统包括:
被配置为接收用于训练决策树(16)的训练数据(14)的输入的分布式控制处理单元(50),训练数据(14)包括多个数据单元(18),每个数据单元(18)进一步包括具有相关类标签的至少一个示例数据;
多个数据批处理单元(54),每个数据批处理单元(54)被配置为从分布式控制处理单元(50)接收表示训练数据(14)中数据单元(18)的子集的分别的数据批次(64),并且被配置为为分别的数据批次(64)评估决策树(16)的多个分裂函数中的每一个,从而为数据批次(64)中的每个分裂函数和每个数据计算部分直方图(56);以及
多个节点批处理单元(58),对于分别的树节点批次(66)中决策树(16)的边缘树节点(48)的每个子集,每个节点批处理单元(58)被配置为聚集每个分裂函数的相关的部分直方图(56)以在子集的每个边缘树节点(48)处为每个分裂函数形成聚集的直方图(60),所述每个节点批处理单元(58)被配置为通过计算为边缘树节点(48)产生最高信息增益的分裂函数来为分别的子集中的每个边缘树节点(48)确定选定的分裂函数;
所述分布式控制处理单元(50)进一步被配置为将每个边缘树节点(48)重新分类为包括分别的一个选定的分裂函数的分裂节点(40),以扩展决策树(16)以包括从分裂节点(40)处分支出的新的边缘树节点(48),并且输出决策树(16)用于安装在下游计算设备(24)上。
2.如权利要求1所述的系统,其特征在于,所述分布式控制处理单元被配置为将接收到的训练数据存储在大容量存储设备中,以将训练数据划分为多个数据批次,并且以将每个数据批次分发给分别的数据批处理单元,以通过每个分别的数据批处理单元为每个数据批次计算分裂函数的部分直方图。
3.如权利要求1所述的系统,其特征在于,所述分布式控制处理单元被配置为为多个节点批处理单元中的每一个分配边缘树节点的分别的子集;
所述多个数据批处理单元中的每一个被配置为从分别的数据批次中选择数据的子集,选定的数据子集包括由决策树分类为位于对应的边缘树节点处的每个数据;以及
所述多个数据批处理单元中的每一个被配置为将选定的数据子集的部分直方图传送到与对应的边缘树节点相关的节点批处理单元,以用于节点批处理单元聚集每个分裂函数的相关的部分直方图以形成聚集的直方图。
4.如权利要求1所述的系统,其特征在于,所述边缘树节点批次处的每个分裂函数的聚集的直方图在分别的节点批处理单元上被计算。
5.如权利要求1所述的系统,其特征在于,所述每个数据单元包含至少一个图像或图像区域,每个图像或图像区域包括至少一个数据,即像素,并且评估分裂函数包括计算像素的像素特征;
所述每个像素具有包括颜色、强度和深度的像素数据,深度由深度照相机确定;
所述像素特征基于目标像素以及该像素邻近的其它像素的像素数据而被计算。
6.如权利要求5所述的系统,其特征在于,所述训练数据包括身体的图像,并且训练数据中的至少若干像素被分类为与身体模型中分别的类相关,类表示对应的身体部位;以及
所述输出的决策树被配置为将目标图像的像素分类为多个类中的一个,每个类与一个边缘树节点相关,至少若干个类表示身体模型上对应的身体部位。
7.如权利要求5所述的系统,其特征在于,所述输出的决策树被输出至游戏控制台以用于处理实时数据流中的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110162273.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:燃烧沉降室
- 下一篇:基于电力线通信的智能室内排风系统