[发明专利]异构系统并行随机森林优化方法和系统在审
申请号: | 201510591067.1 | 申请日: | 2015-09-16 |
公开(公告)号: | CN105046382A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 王娅娟;张广勇;吴韶华;沈铂;卢晓伟;张清 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 解婷婷;曲鹏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 系统 并行 随机 森林 优化 方法 | ||
1.一种异构系统并行随机森林优化系统,其特征在于,应用于中央处理器与协处理器混合异构集群,包括:一个主节点和多个从节点;
所述主节点用于将待计算的数据文件划分成多个数据分片,分别发送数据分片给各所述从节点,接收各所述从节点构建好的决策树生成随机森林;
所述从节点用于接收所述主节点分配的所述数据分片进行计算,将计算后的最优解构建决策树发送到所述主节点。
2.根据权利要求1所述的系统,其特征在于,所述从节点包括至少一个中央处理器和多个协处理器;
所述从节点用于接收所述主节点分配的所述数据分片,包括:所述中央处理器接收所述数据分片,将所述数据分片划分为多个数据分片子集,分配相应的所述数据分片子集给各所述线程,分发线程给各所述协处理器;
所述从节点用于计算所述数据分片并将计算后的最优解构建决策树发送到所述主节点,包括:所述协处理器接收对应的线程获取相应的所述数据分片子集和初始值进行计算,根据计算后的结果获取最优分裂属性构建决策树发送给所述主节点。
3.根据权利要求2所述的系统,其特征在于,所述协处理器用于接收对应的线程获取相应的所述数据分片子集和初始值进行计算之前,还包括:
所述主节点向各所述从节点分配进程,所述进程向所述从节点内所有设备发送调用请求的线程,接收各所述设备返回的调用请求的线程;其中,一个中央处理器作为一个设备,一块协处理器作为一个设备。
4.根据权利要求2所述的系统,其特征在于,所述中央处理器用于划分数据分片为多个数据分片子集,是指:
所述中央处理器按照所述协处理器的数量将数据分片平均划分成多个数据分片子集。
5.根据权利要求2所述的系统,其特征在于,所述协处理器用于根据计算后的结果获取最优分裂属性构建决策树发送给所述主节点,是指:
所述协处理器用于判断计算后的结果是不是最优解,若是,则将所述计算后的最优解的对应的数据分片子集作为最优分裂属性构建决策树,将构建的决策树发送给所述主节点;若不是,则继续计算所述从节点的其他数据分片,直至计算后的结果是最优解或所有数据分片全部处理完。
6.一种异构系统并行随机森林优化方法,应用于异构系统并行随机森林优化系统,其特征在于,所述系统包括:一个主节点和多个从节点;
所述主节点调用将待计算的数据文件划分成多个数据分片,分别发送数据分片给各所述从节点,接收各所述从节点构建好的决策树生成随机森林;
所述从节点接收所述主节点分配的所述数据分片进行计算,将计算后的最优解构建决策树发送到所述主节点。
7.根据权利要求6所述的方法,其特征在于,所述从节点包括至少一个中央处理器和多个协处理器;
所述从节点接收所述主节点分配的所述数据分片,包括:所述中央处理器接收所述数据分片,将所述数据分片划分为多个数据分片子集,分配相应的所述数据分片子集给各所述线程,分发线程给各所述协处理器;
所述从节点计算所述数据分片并将计算后的最优解构建决策树发送到所述主节点,包括:所述协处理器接收对应的线程获取相应的所述数据分片子集和初始值进行计算,根据计算后的结果获取最优分裂属性构建决策树发送给所述主节点。
8.根据权利要求7所述的方法,其特征在于,所述协处理器接收对应的线程获取相应的所述数据分片子集和初始值进行计算之前,还包括:
所述主节点向各所述从节点分配进程,所述进程向所述从节点内所有设备发送调用请求的线程,接收各所述设备返回的调用请求的线程;其中,一个中央处理器作为一个设备,一块协处理器作为一个设备。
9.根据权利要求7所述的方法,其特征在于,所述中央处理器划分数据分片为多个数据分片子集,包括:
所述中央处理器按照所述协处理器的数量将数据分片平均划分成多个数据分片子集。
10.根据权利要求7所述的方法,其特征在于,所述协处理器根据计算后的结果获取最优分裂属性构建决策树发送给所述主节点,包括:
所述协处理器判断计算后的结果是不是最优解,若是,则将所述计算后的最优解的对应的数据分片子集作为最优分裂属性构建决策树,将构建的决策树发送给所述主节点;若不是,则继续计算所述从节点的其他数据分片,直至计算后的结果是最优解或所有数据分片全部处理完。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510591067.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理