[发明专利]一种针对大规模系统深度学习数据并行的分级通信优化方法在审
申请号: | 202110452650.X | 申请日: | 2021-04-26 |
公开(公告)号: | CN114218146A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 刘沙;刘鑫;陈德训;彭超;黄则强;高捷;王宜鹏 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F15/163 | 分类号: | G06F15/163;G06N3/04;G06N3/08 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214038 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 大规模 系统 深度 学习 数据 并行 分级 通信 优化 方法 | ||
1.一种针对大规模系统深度学习数据并行的分级通信优化方法,其特征在于,在深度学习网络模型采用数据并行进行训练的过程中,执行以下操作:
S1、根据所需计算节点总数,从若干个超节点中选择相同数量的计算节点,用于进行数据并行训练;
将计算节点按超节点进行分组,使得每个分组中计算节点数量相同,其中第0号进程为该组计算节点中负责与其它超节点通信的通信节点;
S2、每个计算节点计算出模型参数的梯度后,在分组内部进行MPI_Allreduce通信,计算出分组内的平均梯度;
S3、各分组内的通信节点采用Ring_Allreduce算法进行梯度的Allreduce操作,计算出所有计算节点的平均梯度;
S4、通信节点在分组内部进行Broadcast操作,完成所有计算节点的梯度更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110452650.X/1.html,转载请声明来源钻瓜专利网。