[发明专利]深度学习模型训练方法及其装置、电子设备及存储介质在审

专利信息
申请号: 202110492705.X 申请日: 2021-05-07
公开(公告)号: CN112906909A 公开(公告)日: 2021-06-04
发明(设计)人: 刘山和 申请(专利权)人: 湖北亿咖通科技有限公司
主分类号: G06N20/00 分类号: G06N20/00;G06N3/08
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 项京;赵元
地址: 430056 湖北省武汉市经济技术开发区南*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 深度 学习 模型 训练 方法 及其 装置 电子设备 存储 介质
【说明书】:

本申请实施例提供了一种深度学习模型训练方法、装置、电子设备及存储介质,方法包括:基于样本数据迭代训练深度学习模型,并在每轮迭代训练后判断深度学习模型的参数是否为局部最优参数;若是,基于参数变异率对深度学习模型的参数进行变异;判断变异次数是否达到设定次数,若是,则将局部最优参数确定为深度学习模型的最终参数;若否,则基于变异后的参数继续迭代训练深度学习模型;判断深度学习模型的损失值是否优于基于局部最优参数计算的损失值;若是,则将参数变异率重置为初始值,并返回基于样本数据迭代训练深度学习模型的步骤;若否,返回基于参数变异率对深度学习模型的参数进行变异的步骤。从而能够确定全局最优参数。

技术领域

本申请涉及深度学习技术领域,特别是涉及一种深度学习模型训练方法及其装置、电子设备及存储介质。

背景技术

在深度学习算法中,需要一个损失函数来描述模型输出值与真实值之间的差异,并根据该差异引导深度学习的优化方向,例如采用梯度下降法朝着该差异不断变小的方向进行优化,优化深度学习模型的过程也可以理解为调整深度学习模型中参数的过程。

然而,对于复杂数据场景,例如语音识别等场景,需要设置复杂的损失函数,可能存在多个函数波底。

采用现有的深度学习模型训练方法,如果损失函数较复杂,则可能只得到模型参数的局部最优参数,无法得到模型参数的全局最优参数,导致最终深度学习模型训练效果较差。

发明内容

本申请实施例的目的在于提供一种深度学习模型训练方法及其装置、电子设备及存储介质,以确定深度学习模型的全局最优参数,提高深度学习模型训练效果。具体技术方案如下:

为实现上述目的,本申请实施例提供了一种深度学习模型训练方法,所述方法包括:

基于样本数据迭代训练深度学习模型,并在每轮迭代训练后判断所述深度学习模型的参数是否为局部最优参数;

若是,基于参数变异率对所述深度学习模型的参数进行变异,计算记录基于参数变异率对所述深度学习模型的参数进行变异的变异次数;

判断所述变异次数是否达到设定次数,若是,则将所述局部最优参数确定为所述深度学习模型的最终参数,得到目标深度学习模型;

若否,则基于变异后的参数继续迭代训练所述深度学习模型,针对基于变异后的参数迭代训练的所述深度学习模型,判断所述深度学习模型的损失值是否优于基于所述局部最优参数计算的损失值;其中,损失值表示以所述深度学习模型的参数为变量的损失函数的值;

若是,则将所述参数变异率重置为初始值,并返回基于样本数据迭代训练深度学习模型的步骤;

若否,返回所述基于参数变异率对所述深度学习模型的参数进行变异的步骤。

可选的,所述基于参数变异率对所述深度学习模型的参数进行变异,包括:

以所述参数变异率对所述深度学习模型的参数进行随机替换,得到变异后的参数。

可选的,在基于参数变异率对所述深度学习模型的参数进行变异时,逐步增大参数变异率对所述深度学习模型的参数进行变异。

可选的,所述参数变异率的初始值为零。

可选的,所述深度学习模型为语音识别深度学习模型,所述样本数据为语音样本数据。

为实现上述目的,本申请实施例还提供了一种深度学习模型训练装置,所述装置包括:

训练模块,用于基于样本数据迭代训练深度学习模型,并在每轮迭代训练后判断所述深度学习模型的参数是否为局部最优参数;

第一变异模块,用于若得到局部最优参数,基于参数变异率对所述深度学习模型的参数进行变异,记录基于参数变异率对所述深度学习模型的参数进行变异的变异次数;

变异次数判断模块,用于判断所述变异次数是否达到设定次数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北亿咖通科技有限公司,未经湖北亿咖通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110492705.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top