[发明专利]模型训练的方法、装置及计算机可读存储介质在审
申请号: | 202010600109.4 | 申请日: | 2020-06-28 |
公开(公告)号: | CN113849295A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 王国威;包小明;徐华;周敏均 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 颜晶 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 可读 存储 介质 | ||
本申请公开了一种模型训练的方法、装置及计算机可读存储介质,属于通信领域。所述方法包括:管理节点调度第一模型训练任务,第一模型训练任务包括第一智能模型和第一参数调整作业的作业标识,第一智能模型是基于第一参数值集合对第一参数调整作业对应的算法进行配置得到的;根据作业标识确定第一计算节点,第一计算节点具有第一训练数据和空闲的第一资源中的至少一个,第一资源是用于处理第一参数调整作业所需的资源,第一训练数据是用于训练第一参数调整作业的智能模型所需的训练数据;向第一计算节点发送第一训练请求,第一训练请求用于第一计算节点根据第一资源和第一训练数据中的至少一个,训练第一智能模型。本申请能够提高模型训练的效率。
技术领域
本申请涉及通信领域,特别涉及一种模型训练的方法、装置及计算机可读存储介质。
背景技术
对深度学习等智能算法进行训练,得到具有特定功能的智能模型,该特定功能可以为图像识别,语音识别及合成,或者,自然语言处理等功能。对智能算法进行训练就是不断地调整智能算法的超级参数的取值和普通参数的取值,使智能算法成为具有特定功能的智能模型。超级参数用于定义智能模型的结构和训练过程等,普通参数用于定义智能模型实现的功能。
目前可以使用计算集群来训练智能算法,使用云存储系统存储训练智能算法所需要的训练样本。在训练智能模型时,用户在计算集群中配置智能算法和至少一个超级参数。计算集群初始化每个超级参数的初始值,根据每个超级参数的初始值配置智能算法,得到第一智能模型。为第一智能模型分配资源,以及从云存储系统中调取训练数据,使用该训练数据并通过分配的资源训练第一智能模型。其中计算集群在训练第一智能模型的过程不断地调整第一智能模型的普通参数的取值,直到第一智能模型收敛或无法成功收敛时停止训练,或者,训练第一智能模型的次数达到指定次数时为止。
在停止训练时,计算集群获取对第一智能模型的训练结果,如果该训练结果不满足指定条件,则根据每个超级参数的当前取值和该训练结果等信息,配置每个超级参数的新取值,根据每个超级参数的新取值配置智能算法,得到第二智能模型。为第二智能模型分配资源,以及从云存储系统中调取训练数据,使用该训练数据并通过分配的资源训练第二智能模型。其中在训练第二智能模型的过程也是不断地调整第二智能模型的普通参数的取值,直到第二智能模型收敛或无法成功收敛时停止训练,或者,训练第二智能模型的次数达到指定次数时为止。
在停止训练第二智能模型时,计算集群仍获取对第二智能模型的训练结果,如果第二智能模型的训练结果不满足指定条件,重复上述获取第二智能模型和训练第二智能模型的过程,如果第二智能模型的训练结果满足指定条件,则第二智能模型为最终训练出的具有特定功能的模型。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:
在上述过程中,每次配置得到一个智能模型时,需要重新为该智能模型分配资源以及从云存储系统中调取训练数据,增加了耗时,降低了模型训练的效率。
发明内容
本申请提供了一种模型训练的方法、装置及计算机可读存储介质,以提高模型训练的效率。所述技术方案如下:
第一方面,本申请提供了一种模型训练的方法,在所述方法中,管理节点调度第一模型训练任务,第一模型训练任务包括第一智能模型和第一参数调整作业的作业标识,第一智能模型是基于第一参数值集合对第一参数调整作业对应的算法进行配置得到的,第一参数值集合包括第一参数调整作业对应的至少一个超级参数中的每个超级参数的第一参数值。管理节点根据该作业标识从节点集群中确定第一计算节点,第一计算节点具有第一训练数据和空闲的第一资源中的至少一个,第一资源是用于处理第一参数调整作业的模型训练任务所需的资源,第一训练数据是用于训练第一参数调整作业对应的智能模型所需的训练数据。管理节点向第一计算节点发送第一训练请求,第一训练请求包括第一模型训练任务,第一训练请求用于第一计算节点根据第一资源和第一训练数据中的至少一个,训练第一智能模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010600109.4/2.html,转载请声明来源钻瓜专利网。