[发明专利]分布式决策树训练无效

专利信息
申请号: 201110162273.2 申请日: 2011-06-08
公开(公告)号: CN102331992A 公开(公告)日: 2012-01-25
发明(设计)人: J·肖顿;M-D·布迪尤;A·W·费茨吉本;M·菲诺齐奥;R·E·摩尔;D·罗伯逊 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海专利商标事务所有限公司 31100 代理人: 黄嵩泉
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 决策树 训练
【说明书】:

技术领域

发明涉及计算机领域,尤其涉及计算机领域中的决策树训练。

背景技术

可以运用机器学习技术以使得计算机能够处理实验数据并且得出关于其的结论。一个示例的机器学习技术是基于示例数据训练决策树,以及应用经训练的决策树以将未知数据分类为若干类中的一个。在众多应用中,为决策树的训练使用尽可能大的数据集可以获得更准确的结果。但是,使用大数据集的决策树训练的一个缺点是这种训练可以使计算系统的处理器或存储器资源无法承受,从而造成决策树的训练是不实际或不可能的。因此,计算机科学家和软件开发者受到他们可以用来训练决策树的数据集大小和复杂度的限制,并且难以取得在这种决策树的分类能力上的改进。

发明内容

提供计算机化的决策树训练系统和方法。计算机化的决策树训练系统可以包括被配置为接收用于训练决策树的训练数据输入的分布式控制处理单元。系统可以进一步包括多个数据批处理单元,其中每个数据批处理单元被配置为为分别的训练数据的数据批次对决策树的多个分裂函数中的每一个评估,从而为每个分裂函数、为数据批次中的每个数据计算部分的直方图。系统可以进一步包括多个节点批处理单元,节点批处理单元被配置为为每个分裂函数聚集相关的部分直方图,以为边缘树节点的子集中的每个节点的每个分裂函数形成聚集的直方图,并且被配置为通过计算为边缘树节点产生最高的信息增益的分裂函数来为每个边缘树节点确定选定的分裂函数。

提供本概述以便用一种简单的形式介绍将在以下详细描述中进一步描述的一些概念。本概述不旨在确定所要求保护的主题的关键或必要特征,也不旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任何部分中注释的任何或所有缺点的实施。

附图说明

图1是依照本发明的一个实施例的计算机化的决策树训练系统的示意图。

图2是示出可以由图1中的系统计算的决策树的示意图。

图3是示出可以由图1中的系统实现的决策树的深度优先训练的示意图。

图4是示出可以由图1中的系统实现的决策树的广度优先训练的示意图。

图5是图1中计算机化的决策树训练系统的机器学习计算机系统的详细示意图,其被配置为通过处理分别的处理单元上的数据批次和节点批次以训练决策树。

图6是示出可以由图1中的系统实现的混合广度优先/深度优先训练算法的示意图。

图7是图1中计算机化的决策树训练系统的机器学习计算机系统的另一个实施例的详细示意图,其被配置为通过处理分别的处理单元上的分裂函数以训练决策树。

图8是计算机化的决策树训练方法的一个实施例的流程图。

具体实施方式

图1示出计算机化的决策树训练系统10。计算机化的决策树训练系统10包括被配置为接收训练数据14、处理训练数据14和输出已训练的决策树16的机器学习计算机系统12。训练数据14包括已经被分类为预定数量的类中的一个类的众多示例。依照以下所述的过程,可以基于训练数据14来训练决策树16。

训练数据14可以包括各种数据类型,并且一般地被组织为多个数据单元18。在一个特定示例中,数据单元18可以包含图像20或图像区域,该图像或图像区域依次包括像素数据22。替代地或额外地,数据单元18可以包括音频数据、视频序列、3D医学扫描或其它数据。

紧接着计算机化的决策树训练系统10的决策树16的训练,可以在下游计算设备24的输入模块26中安装决策树16,以用于处理和分类由输入模块26从与计算设备24相关的数据源30接收的数据流28中的数据。在一个示例中,数据源30是深度照相机,计算设备24是游戏控制台,并且数据流28包含一系列包括实时地从深度照相机接收的深度信息的图像。在另一个示例中,数据源30可以是话筒,并且数据流可以包含音频信号流。而在另一个示例中,数据源30可以是医学成像设备,计算设备24可以是医学分析计算机,并且数据流28可以包含从医学成像设备接收的一系列图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110162273.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top