[发明专利]模型训练方法、终端及存储介质在审
申请号: | 202010760865.3 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111860789A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 刘君 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚璐;张颖玲 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 终端 存储 介质 | ||
本申请实施例公开了一种模型训练方法、终端及存储介质,该模型训练方法包括:在通过训练数据训练预测模型时,配置第i权重;其中,第i权重用于对预测模型进行第i轮训练;i为大于0的整数;将训练数据输入至预测模型,获得第i损失值,并根据第i损失值和偏差下限阈值确定第i学习率;其中,第i损失值用于确定预测模型输出的预测值与真实值之间的偏差程度;根据第i学习率配置第(i+1)权重,并根据第(i+1)权重对预测模型进行第(i+1)轮训练,直到获得完成训练的预测模型;使用完成训练的预测模型对待预测对象进行预测处理。
技术领域
本发明涉及神经网络技术领域,尤其涉及一种模型训练方法、终端及存储介质。
背景技术
在使用梯度下降法进行模型训练时,可以通过对学习率的调整来实现对权重的更新。由于合适的学习率会加快模型的收敛速度,而不理想的学习率可能会使目标函数的损失值急剧上升,无法完成模型的训练。因此,选择一个合适的学习率,对于模型的训练将至关重要。
目前,常见的学习率的调整方法主要包括离散下降、指数减缓以及分数减缓等,具体地,上述调整方法均是随着训练轮数的增加按照一定的规律对学习率进行递减的调整,而这种依赖训练轮数的调整方法并不能获得最为合适的学习率,进而降低了模型的收敛速度。
发明内容
本申请实施例提供了一种模型训练方法、终端及存储介质,在进行模型训练时,能够及时更新学习率,获得最为合适的学习率,从而提升了模型的收敛速度。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供了一种模型训练方法,所述方法包括:
在通过训练数据训练预测模型时,配置第i权重;其中,所述第i权重用于对所述预测模型进行第i轮训练;所述i为大于0的整数;
将所述训练数据输入至所述预测模型,获得第i损失值,并根据所述第i损失值和偏差下限阈值确定第i学习率;其中,所述第i损失值用于确定所述预测模型输出的预测值与真实值之间的偏差程度;
根据所述第i学习率配置第(i+1)权重,并根据所述第(i+1)权重对所述预测模型进行第(i+1)轮训练,直到获得完成训练的预测模型;
使用所述完成训练的预测模型对待预测对象进行预测处理。
第二方面,本申请实施例提供了一种终端,所述终端包括:配置单元,获取单元,确定单元,训练单元,预测单元,
所述配置单元,用于在通过训练数据训练预测模型时,配置第i权重;其中,所述第i权重用于对所述预测模型进行第i轮训练;所述i为大于0的整数;
所述获取单元,用于将所述训练数据输入至所述预测模型,获得第i损失值;
所述确定单元,用于根据所述第i损失值和偏差下限阈值确定第i学习率;
所述配置单元,还用于根据所述第i学习率配置第(i+1)权重;
所述训练单元,用于根据所述第(i+1)权重对所述预测模型进行第(i+1)轮训练,直到获得完成训练的预测模型;
所述预测单元,用于使用所述完成训练的预测模型对待预测对象进行预测处理。
第三方面,本申请实施例提供了一种终端,所述终端包括处理器、存储有所述处理器可执行指令的存储器,当所述指令被所述处理器执行时,实现如上所述的模型训练方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有程序,应用于终端中,所述程序被处理器执行时,实现如上所述的模型训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010760865.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示基板及其制备方法、掩膜版
- 下一篇:一种闭合装置及具有该装置的门窗、柜体