[发明专利]异构计算中的并行加速方法及系统有效
申请号: | 201611070675.9 | 申请日: | 2016-11-29 |
公开(公告)号: | CN106776014B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 吴婷;张致江;王智国;于振华;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F15/80 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 赵景平;宋少华 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 中的 并行 加速 方法 系统 | ||
1.一种异构计算中的并行加速方法,其特征在于,包括:
预先根据GPU的个数确定GPU之间数据传输的拓扑结构;
所述拓扑结构中的各GPU获取当前任务,并对所述当前任务中的数据进行计算,得到对应当前任务的计算结果;
各GPU将自己得到的对应当前任务的计算结果分享给所述拓扑结构中的所有其它GPU,以使各GPU进行数据更新,具体包括:
如果所述拓扑结构为包含两个节点的一条边,则两个节点分别将各自得到的对应当前任务的计算结果发送给对方;
如果所述拓扑结构为四边形结构,则预先设定四边形中任意两个相邻节点为固定节点;在进行数据分享时,所述固定节点先将自己对应当前任务的计算结果发送给其相邻节点,然后两固定节点之间、两固定节点的相邻节点之间进行通信,将各自对应当前任务的计算结果以及得到的各自相邻节点的计算结果一起发送给对方;
如果所述拓扑结构为一个立方体结构,则预先设定立方体中的任意两个相对面为固定面;在进行数据分享时,所述固定面中各节点先按照所述四边形结构中的节点通信方式进行通信,得到同一面上所有其它节点的计算结果,然后两个相对固定面之间对应的节点进行通信,将各自对应当前任务的计算结果以及得到的同一面上所有其它节点的计算结果一起发送给对方;
如果所述拓扑结构为多个立方体结构,则预先将所述多个立方体两两组成立方体对;在进行数据分享时,每个立方体对中的两个立方体中的节点各自先按照所述立方体结构中的节点通信方式进行通信,得到同一立方体中所有其它节点的计算结果,然后每个立方体对中的两个立方体之间对应节点进行通信,得到该立方体对中所有其它节点的计算结果;最后不同立方体对之间相对应的节点进行通信,将各自对应当前任务的计算结果以及得到的其它立方体对中所有其它节点的计算结果一起发送给对方;
各GPU得到所述拓扑结构中的所有其它GPU的计算结果后,开始执行下一任务。
2.根据权利要求1所述的方法,其特征在于,所述GPU的个数为2的指数次方。
3.根据权利要求2所述的方法,其特征在于,所述根据GPU的个数确定GPU之间数据传输拓扑结构包括:
如果GPU的总数为2,则所述拓扑结构为包含两个节点的一条边,每个节点为一个GPU;
如果GPU的总数为4,则所述拓扑结构为四边形结构,所述四边形中每个节点为一个GPU;
如果GPU的总数为8,则所述拓扑结构为立方体结构,每个立方体的节点为一个GPU;
如果GPU的总数是8的n倍,n为大于或等于2的偶数,则所述拓扑结构为n个立方体结构,每个立方体的节点为一个GPU。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述GPU的个数不是2的指数次方,则通过增加或删除GPU,使GPU的总数为2的指数次方。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611070675.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多系统的资源调度方法及装置
- 下一篇:一种并行程序任务处理方法及其装置