[发明专利]用于任意树形拓扑的灵活、快速全归约的方法在审
申请号: | 202080018167.4 | 申请日: | 2020-03-17 |
公开(公告)号: | CN113518973A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 李振浩;S·沙;赵敏植 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 任意 树形 拓扑 灵活 快速 全归约 方法 | ||
1.一种用于跨处理器发送数据以在所述处理器上组合所述数据的方法,所述方法包括:
在处理器集P(P1、P2、…、Pk)处接收数据集D(D1、D2、…、Dn),其中数据Di在处理器Pi处被接收;
将所述数据集的目标部分分配给所述处理器集中的处理器,其中所述处理器集被配置在包括根和一个或多个叶子的树形拓扑中,并且其中所述目标部分是基于被连接到父节点的子处理器的数目而被分配的;
从所述一个或多个叶子开始,在所述树形拓扑的每个分支中共享相同父节点的子处理器之间发送迭代分配的组合数据,并且增加所述树形拓扑中的级别,直到到达根;以及
在子处理器之间从一个分支向至少一个其它分支中的子处理器发送所述组合数据。
2.根据权利要求1所述的方法,其中所述组合数据使用环形算法在共享相同父节点的子处理器之间被发送。
3.根据权利要求1所述的方法,其中所述组合数据使用层级算法在共享相同父节点的子处理器之间被发送。
4.根据权利要求3所述的方法,还包括:
通过将针对分支的当前目标部分除以所述分支的度来分配所述数据集的下一目标部分;以及
将所述下一目标部分分配给所述分支中的每个子处理器。
5.根据权利要求1所述的方法,其中每个目标部分被分配与所述数据集的一部分相对应的范围;以及
其中发送所述迭代分配的组合数据包括在所述子处理器之间的相同的所述范围内发送数据。
6.根据权利要求5所述的方法,其中在子处理器之间从一个分支向至少一个其它分支中的子处理器发送所述组合数据包括在所述子处理器之间相同的所述范围内从一个分支向至少一个其它分支中的所述子处理器发送数据。
7.根据权利要求1所述的方法,其中所述组合数据以与发送所述组合数据的顺序相反的顺序从所述处理器集被收集。
8.根据权利要求1所述的方法,其中所述处理器集中的至少一个处理器是图形处理单元(GPU)。
9.一种用于跨处理器发送数据以在所述处理器上组合所述数据的计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有随其体现的程序指令,所述程序指令能够由处理器集中的处理器执行以使所述处理器执行方法,所述方法包括:
在处理器集P(P1、P2、…、Pk)处接收数据集D(D1、D2、…、Dn),其中数据Di在处理器Pi处被接收;
将所述数据集的目标部分分配给所述处理器集中的处理器,其中所述处理器集被配置在包括根和一个或多个叶子的树形拓扑中,并且其中所述目标部分是基于被连接到父节点的子处理器的数目而被分配的;
从所述一个或多个叶子开始,在所述树形拓扑的每个分支中共享相同父节点的子处理器之间发送迭代分配的组合数据,并且增加所述树形拓扑中的级别,直到到达根;以及
在子处理器之间从一个分支向至少一个其它分支中的子处理器发送所述组合数据。
10.根据权利要求9所述的计算机程序产品,其中所述组合数据使用环形算法或层级算法中的至少一个算法在共享相同父节点的子处理器之间被发送。
11.根据权利要求9所述的计算机程序产品,所述方法还包括:
通过将针对分支的当前目标部分除以所述分支的度来分配所述数据集的下一目标部分;以及
将所述下一目标部分分配给所述分支中的每个子处理器。
12.根据权利要求9所述的计算机程序产品,其中每个目标部分被分配与所述数据集的一部分相对应的范围;以及
其中发送所述迭代分配的组合数据包括在所述子处理器之间的相同的所述范围内发送数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080018167.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:生成图像信号的装置和方法
- 下一篇:夹层玻璃