[发明专利]一种针对大规模系统深度学习数据并行的分级通信优化方法在审
申请号: | 202110452650.X | 申请日: | 2021-04-26 |
公开(公告)号: | CN114218146A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 刘沙;刘鑫;陈德训;彭超;黄则强;高捷;王宜鹏 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F15/163 | 分类号: | G06F15/163;G06N3/04;G06N3/08 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214038 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种针对大规模系统深度学习数据并行的分级通信优化方法,S1、根据所需计算节点总数,从若干个超节点中选择相同数量的计算节点,将计算节点按超节点进行分组;S2、每个计算节点计算出模型参数的梯度后,在分组内部进行MPI_Allreduce通信,计算出分组内的平均梯度;S3、各分组内的通信节点采用Ring_Allreduce算法进行梯度的Allreduce操作,计算出所有计算节点的平均梯度;S4、通信节点在分组内部进行Broadcast操作,完成所有计算节点的梯度更新。本发明在大规模分布式深度学习应用中的梯度更新过程中,减少了高延迟通信次数,充分利用了高速网络的通信性能,提高了通信效率。 | ||
搜索关键词: | 一种 针对 大规模 系统 深度 学习 数据 并行 分级 通信 优化 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110452650.X/,转载请声明来源钻瓜专利网。