[发明专利]基于容器技术的深度学习模型训练方法、设备及存储介质在审
申请号: | 202011568481.8 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112700004A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 杨正刚;李小芬;杨育;易文峰 | 申请(专利权)人: | 南方电网深圳数字电网研究院有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄广龙 |
地址: | 518000 广东省深圳市南山区沙河街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 容器 技术 深度 学习 模型 训练 方法 设备 存储 介质 | ||
本发明公开了一种基于容器技术的深度学习模型训练方法设备及存储介质,包括,基于容器技术配置深度学习模型训练所需的环境和组件;在所述第一容器中构建第一深度学习模型;在第二容器中构建第二深度学习模型;输入第一训练数据到第一深度学习模型进行训练;将第一容器的训练数据迁移到第二容器得到第二深度学习模型;输入第二训练数据到第二深度学习模型,进行优化输出参数。本发明能够统一资源调度,减少数据冗余,提高训练效率,减少资源成本,实用性强。
技术领域
本发明涉及人工智能深度学习技术领域,尤其涉及基于容器技术的深度学习模型训练方法、设备及存储介质。
背景技术
现有的深度学习模型的训练方法,按照完整训练流程去训练一个深度学习模型,需要搭建对应的环境,从零开始训练,耗时较长,并且当训练模型素材有变化,则每次都需从零开始重新训练,搭配训练环境步骤繁琐复杂,模型训练资源消耗大,资源利用率低,数据冗余度高,训练成本高。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供一种基于容器技术的深度学习模型训练方法、设备及存储介质。
本发明解决其问题所采用的技术方案是:
本发明的第一方面,一种基于容器技术的深度学习模型训练方法,包括:
根据所述容器技术构建基础运行环境;
在所述基础运行环境中形成第一容器,在所述第一容器中构建第一深度学习模型;
输入第一训练数据至所述第一深度学习模型进行训练;
在所述基础运行环境中形成第二容器,将所述第一容器的数据迁移到所述第二容器,得到第二深度学习模型;
输入第二训练数据至第二深度学习模型进行训练,优化所述第二深度学习模型的输出层的参数。
根据本发明的第一方面,所述根据所述容器技术构建基础运行环境具体为:
在服务器上安装Docker;
获取深度学习框架的框架镜像;
建立训练指令与所述基础运行环境之间的调度关系,其中所述训练指令用于控制深度学习模型进行训练
根据本发明的第一方面,在所述基础运行环境中形成所述第一容器,在所述第一容器中构建第一深度学习模型的步骤具体为:
通过指令控制器发送激活指令到消息队列;
读取所述激活指令,激活所述框架镜像,形成所述第一容器;
将与深度学习模型对应的代码固化到所述第一容器形成所述第一深度学习模型。
根据本发明的第一方面,将所述第一训练数据输入至所述第一深度学习模型进行训练的具体步骤为:
将所述第一训练数据输入至所述第一容器;
通过指令控制器发送所述训练指令到消息队列;
读取所述消息队列中的所述训练指令的开始训练消息后,使所述第一深度学习模型从文件系统拉取所述第一训练数据;
使所述第一训练数据对所述第一深度学习模型训练,形成第一模型文件。
根据本发明的第一方面,在所述基础运行环境中形成所述第二容器,所述第一容器的数据迁移到所述第二容器,得到所述第二深度学习模型,包括以下步骤:
通过所述指令控制器发送激活指令到消息队列;
读取消息队列中的所述激活指令,激活所述框架镜像,形成所述第二容器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网深圳数字电网研究院有限公司,未经南方电网深圳数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011568481.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效率农产品筛选装置
- 下一篇:用于压力机的下顶料机构