[发明专利]一种神经网络的针对模型并行的动态负载均衡方法在审
申请号: | 202110453555.1 | 申请日: | 2021-04-26 |
公开(公告)号: | CN114217944A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 漆锋滨;刘鑫;高捷;陈德训;刘沙;彭超;黄则强;王宜鹏 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/04;G06N3/08 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214038 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 针对 模型 并行 动态 负载 均衡 方法 | ||
1.一种神经网络的针对模型并行的动态负载均衡方法,其特征在于:根据不同的模型和系统的相应参数给出切分策略,并在训练过程中进一步迭代更新;
根据不同的模型和系统的相应参数,给出对模型网络的切分策略,具体包括以下步骤:
S1、基于模型类型、参数量、网络集群拓扑带宽和节点数信息构建代价模型,用于评估每个算子的输入、输出和运行所需的计算时间,还用于评估相邻算子以及算子内部存在的通信时间;
S2、根据S1中得到的代价模型,为所有节点分配应计算的算子,具体步骤如下:
S21、代价模型对当前系统中的所有可用的计算节点进行状态模拟,然后依次遍历代价模型的整个计算图,针对每个算子获得至少一个用于完成当前算子的可用节点作为计算节点;
S22、对于具有多个可用节点的算子,节点分配算法使用贪婪启发式算法来评估将其放置在每个可用节点上的预计完成时间,选取出预计最快完成当前算子的可用节点作为其映射的计算节点;
S23、对于每个算子,重复S22,继续为其余算子分配计算节点,直至为计算图中的每个算子完成计算节点分配;
在训练过程中进一步迭代更新,具体包括以下步骤:
S3、训练前为每个计算节点分配一个权重参数,用来表示分配到的负载量,权重越大分配到的负载量越多,初始时各个节点的权重参数相等;
S4、每轮训练时,首先根据上一步骤得到的当前节点的权重参数,通过代价模型找出所有计算节点的切分策略并开始训练,每个计算节点在计算完成后统计自身的等待时间;
S5、一轮训练完后,根据S4中得到的各个计算节点的最大等待时间和平均等待时间,判断当前的负载均衡是否最优,如果是,则保持当前的切分策略继续训练,如果不是最优,将根据各个计算节点间的等待时间的比重,调整各自的权重,从而改变每个计算节点应当分配到的负载量,随后通过代价模型重新计算出切分策略并执行下一轮训练;
S6、重复S4-S5直至在数次训练中不改变当前切分策略,即证明该切分策略在训练中动态达到最优。
2.根据权利要求1所述的一种神经网络的针对模型并行的动态负载均衡方法,其特征在于:S21中,对于每个遍历到的算子,首先考虑其可用的节点列表,如果某个节点不提供当前算子的内核实现,那么当前设备对该算子就是不可用的。
3.根据权利要求1所述的一种神经网络的针对模型并行的动态负载均衡方法,其特征在于:S22中,在评估过程中,贪婪启发式算法不仅考虑每个当前可用节点中等待执行的算子的预计完成时间,从而估算出当前算子的预计完成时间,还要考虑如果将算子放置在当前节点,那么将该算子的输入从其他节点传输过来的通信时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110453555.1/1.html,转载请声明来源钻瓜专利网。