[发明专利]一种基于拓扑结构提高深度学习训练速度的方法及装置在审

专利信息
申请号: 201910785997.9 申请日: 2019-08-23
公开(公告)号: CN110647999A 公开(公告)日: 2020-01-03
发明(设计)人: 王超 申请(专利权)人: 苏州浪潮智能科技有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 37105 济南诚智商标专利事务所有限公司 代理人: 李修杰
地址: 215100 江苏省苏州市吴*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 学习训练 互联关系 拓扑结构 绑定 优先级关系 带宽限制 任务判断 拓扑关系 拓扑信息 互联 通讯
【权利要求书】:

1.一种基于拓扑结构提高深度学习训练速度的方法,其特征是,包括:

获取CPU以及GPU的拓扑信息并进行保存;

根据训练任务判断所需GPU是否为一个,如果判断结果为是,根据拓扑信息,选择与该GPU具有互联关系的CPU和所述GPU进行绑定,执行深度学习训练任务;

如果判断结果为否,根据GPU拓扑信息确定GPU的优先级关系,根据所述GPU的优先级关系确定GPU的编号,根据确定的GPU编号依次选择与该GPU具有互联关系的CPU和所述GPU进行绑定,执行深度学习训练任务。

2.根据权利要求1所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,所述训练任务包括单机单卡任务以及单机多卡任务,其中单机单卡任务为单个计算设备单个GPU完成的训练任务,所述单机多卡任务为单个计算设备多个GPU完成的训练任务。

3.根据权利要求1所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,所述保存形式为数据库或列表。

4.根据权利要求1所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,所述GPU的优先级关系具体包括:第一优先级为具有nvlink方式连接的GPU,第二优先级为具有PCIE switch方式连接的GPU,第三优先级为具有PCIE方式连接的GPU,其中,第一优先级高于第二优先级,第二优先级高于第三优先级。

5.根据权利要求4所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,所述第二优先级中PCIE switch方式具体包括PIX模式,PXB模式。

6.根据权利要求4所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,所述第三优先级中PCIE方式具体包括PHB模式,NODE模式,SYS模式。

7.根据权利要求1所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,当训练任务判断所需GPU为一个时,根据拓扑信息,和所述GPU进行绑定的CPU数目为4个。

8.根据权利要求1所述的基于拓扑结构提高深度学习训练速度的方法,其特征是,选取与GPU的绑定的CPU两两不同。

9.一种基于拓扑结构提高深度学习训练速度的装置,其特征是,包括:

获取模块,获取CPU以及GPU的拓扑信息并进行保存;

判断模块,根据训练任务判断所需GPU是否为一个,如果判断结果为是,根据拓扑信息,选择与该GPU具有互联关系的CPU和所述GPU进行绑定,执行深度学习训练任务;

多卡选择模块,如果判断结果为否,根据GPU拓扑信息确定GPU的优先级关系,根据所述GPU的优先级关系确定GPU的编号,根据确定的GPU编号依次选择与该GPU具有互联关系的CPU和所述GPU进行绑定,执行深度学习训练任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910785997.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top