[发明专利]用于训练深度学习模型的方法和制品、以及计算系统有效
申请号: | 201810878224.0 | 申请日: | 2018-08-03 |
公开(公告)号: | CN110795228B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 崔嵬;李三平;王鲲 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/455;G06F15/163 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;丁君军 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 深度 学习 模型 方法 制品 以及 计算 系统 | ||
1.一种用于训练深度学习模型的方法,包括:
在计算系统的一个或多个服务器节点上提供多个加速器资源以执行分布式深度学习模型训练过程以训练所述深度学习模型;
将训练数据集划分成多个小批量数据集;
根据初始作业划分比率将初始小批量数据集划分成多个子批量数据集;
通过所述加速器资源中的每个加速器资源处理所述初始小批量数据集的所述子批量数据集中对应的一个子批量数据集来执行所述分布式深度学习模型训练过程的初始小批量迭代;以及
执行迭代批量大小调整过程以迭代地调整所述作业划分比率,以用于所述分布式深度学习模型训练过程的后续小批量迭代,其中所述迭代批量大小调整过程包括:
确定针对所述加速器资源中的每个加速器资源的作业完成时间,以完成所述初始小批量数据集的所述子批量数据集中所述对应的一个子批量数据集的处理;
确定由于针对所述初始小批量迭代的所述初始作业划分比率导致的所述加速器资源的所述作业完成时间的变化量;
将所确定的所述变化量与变化阈值进行比较;以及
响应于所述作业完成时间的所确定的所述变化量超过所述变化阈值,调整所述作业划分比率,以用于将下一小批量数据集划分成子批量数据集,以用于所述分布式深度学习模型训练过程的下一小批量迭代。
2.根据权利要求1所述的方法,其中调整所述作业划分比率以用于将所述下一小批量数据集划分成所述多个子批量数据集以用于所述分布式深度学习模型训练过程的所述下一小批量迭代包括:
确定具有针对所述初始小批量迭代的最快作业完成时间的加速器资源;
确定具有针对所述初始小批量迭代的最慢作业完成时间的加速器资源;以及
基于作业划分比率调整值,调整被确定为具有所述最快作业完成时间和所述最慢作业完成时间的所述加速器资源之间的所述作业划分比率。
3.根据权利要求2所述的方法,其中调整被确定为具有所述最快作业完成时间和所述最慢作业完成时间的所述加速器资源之间的所述作业划分比率包括:
将被分配给被确定为具有所述最慢作业完成时间的所述加速器资源的所述子批量数据集的大小减小对应于所述作业划分比率调整值的量;以及
将被分配给被确定为具有所述最快作业完成时间的所述加速器资源的所述子批量数据集的大小增加对应于所述作业划分比率调整值的量。
4.根据权利要求1所述的方法,其中根据所述初始作业划分比率将所述初始小批量数据集划分成所述多个子批量数据集包括:将初所述始小批量数据集划分成多个相同大小的子批量数据集。
5.根据权利要求1所述的方法,其中根据所述初始作业划分比率将所述初始小批量数据集划分成所述多个子批量数据集包括:将初所述始小批量数据集划分成多个子批量数据集,其中所述子批量数据集中的至少一些子批量数据集是不同大小的。
6.根据权利要求1所述的方法,其中执行所述迭代批量大小调整过程以迭代地调整所述作业划分比率以用于所述分布式深度学习模型训练过程的后续小批量迭代进一步包括:
针对当前小批量迭代:
根据当前作业划分比率将当前小批量数据集划分成多个子批量数据集;
确定针对所述加速器资源中的每个加速器资源的作业完成时间,以完成所述当前小批量数据集的所述子批量数据集中所述对应的一个子批量数据集的处理;
确定由于针对所述当前小批量迭代的所述当前作业划分比率导致的所述加速器资源的所述作业完成时间的变化量;
将所确定的所述变化量与所述变化阈值进行比较;
响应于所述作业完成时间的所确定的所述变化量超过所述变化阈值,调整所述作业划分比率,以用于将下一小批量数据集划分成多个子批量数据集,以用于所述分布式深度学习模型训练过程的下一小批量迭代;以及
响应于所述作业完成时间的所确定的所述变化量未超过所述变化阈值,维持所述当前作业划分比率,以用于将剩余的小批量数据集划分成多个子批量数据集,以用于所述分布式深度学习模型训练过程的剩余的小批量迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810878224.0/1.html,转载请声明来源钻瓜专利网。