[发明专利]一种深度学习框架的部署方法以及系统在审
申请号: | 201810735143.5 | 申请日: | 2018-07-06 |
公开(公告)号: | CN109189401A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 江训玉 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F8/61 | 分类号: | G06F8/61 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;卢军峰 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源调度 构建 学习 部署 资源利用率 弹性部署 可伸缩性 学习平台 资源损耗 作业请求 低延时 线程 服务器 统一 | ||
1.一种深度学习框架的部署方法,其特征在于,包括:
在服务器上安装Docker;
利用Docker容器获取构建深度学习框架的镜像;
在所述深度学习框架中构建资源调度平台;
通过所述资源调度平台执行深度学习作业请求。
2.根据权利要求1所述的深度学习框架的部署方法,其特征在于,所述Docker容器包括用于访问GPU的nvidia-Docker容器。
3.根据权利要求1所述的深度学习框架的部署方法,其特征在于,所述资源调度平台为Slurm资源调度平台、YARN资源调度平台、和MESOS资源调度平台之中的一种。
4.根据权利要求3所述的深度学习框架的部署方法,其特征在于,通过所述资源调度平台执行深度学习作业请求包括:
创建Slurm文件,并将所述Slurm文件提交至所述Slurm资源调度平台进行调度;
执行前处理,以创建作业所需的容器;
运行创建的所述Slurm文件和所述容器,开始计算作业;
执行后处理,以销毁所述容器。
5.根据权利要求4所述的深度学习框架的部署方法,其特征在于,执行前处理,以创建作业所需的容器包括:
创建资源调度的前处理文件,所述前处理文件用于配置环境变量以及所述容器的创建。
6.根据权利要求4所述的深度学习框架的部署方法,其特征在于,执行后处理,以销毁所述容器包括:
创建资源调度的后处理文件,所述后处理文件用于所述容器的销毁。
7.一种深度学习框架的部署系统,其特征在于,包括:
安装模块,用于在服务器上安装Docker;
镜像模块,利用Docker容器获取构建深度学习框架的镜像;
调度模块,用于在所述深度学习框架中构建资源调度平台;
执行模块,用于通过所述资源调度平台执行深度学习作业请求。
8.根据权利要求7所述的深度学习框架的部署系统,其特征在于,所述Docker容器包括用于访问GPU的nvidia-Docker容器。
9.根据权利要求7所述的深度学习框架的部署系统,其特征在于,所述资源调度平台为Slurm资源调度平台、YARN资源调度平台、和MESOS资源调度平台之中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810735143.5/1.html,转载请声明来源钻瓜专利网。