[发明专利]模型训练方法、终端及存储介质在审
申请号: | 202010760865.3 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111860789A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 刘君 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚璐;张颖玲 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 终端 存储 介质 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
在通过训练数据训练预测模型时,配置第i权重;其中,所述第i权重用于对所述预测模型进行第i轮训练;所述i为大于0的整数;
将所述训练数据输入至所述预测模型,获得第i损失值,并根据所述第i损失值和偏差下限阈值确定第i学习率;其中,所述第i损失值用于确定所述预测模型输出的预测值与真实值之间的偏差程度;
根据所述第i学习率配置第(i+1)权重,并根据所述第(i+1)权重对所述预测模型进行第(i+1)轮训练,直到获得完成训练的预测模型;
使用所述完成训练的预测模型对待预测对象进行预测处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第i损失值和偏差下限阈值确定第i学习率,包括:
根据所述第i损失值和偏差下限阈值确定第i误差;
若所述第i误差不满足预设误差要求,则根据所述第i误差确定所述第i学习率。
3.根据权利要求2所述的方法,其特征在于,
在对所述预测模型进行第一轮训练之前,初始化第一权重值、调节参数、第一学习率以及所述偏差下限阈值;其中,所述调节参数用于进行学习率的更新。
4.根据权利要求3所述的方法,其特征在于,
在根据所述第一权重对所述预测模型进行第一轮训练之后,获得第一损失值;
根据所述第一损失值和所述偏差下限阈值确定第一误差;
若所述第一误差不满足所述预设误差要求,则根据所述第一学习率确定第二权重,并根据所述第二权重对所述预测模型进行第二轮训练。
5.根据权利要求3或4所述的方法,其特征在于,所述调节参数包括比例调节系数、积分调节系数以及微分调节系数;
相应地,所述调节参数通过比例调节、积分调节以及微分调节中的至少一种调节方式进行学习率的更新。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第i误差确定第i学习率,包括:
根据所述调节参数和所述第i误差计算所述第i学习率。
7.根据权利要求5所述的方法,其特征在于,所述根据所述第i误差确定所述第i学习率,包括:
按照所述第i误差调整所述调节参数,获得调整后的调节参数;
根据所述调整后的调节参数和所述第i误差计算所述第i学习率。
8.根据权利要求5所述的方法,其特征在于,所述初始化所述调节参数包括:
将所述微分调节系数的取值设置为0。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第i误差确定所述第i学习率,包括:
若所述第i误差满足预设突变条件,则将所述微分调节系数的取值调整为大于0,获得所述调整后的调节参数;
根据所述调整后的调节参数和所述第i误差计算所述第i学习率。
10.根据权利要求2所述的方法,其特征在于,所述根据所述第i损失值和偏差下限阈值确定第i误差之后,所述方法还包括:
若所述第i误差不属于预设误差范围,则判定所述第i误差不满足所述预设误差要求;
若所述第i误差属于所述预设误差范围,则判定所述第i误差满足所述预设误差要求。
11.根据权利要求2所述的方法,其特征在于,所述根据所述第i损失值和偏差下限阈值确定第i误差之后,所述方法还包括:
若所述第i误差不等于0,则判定所述第i误差不满足所述预设误差要求;
若所述第i误差等于0,则判定所述第i误差满足所述预设误差要求。
12.根据权利要求1所述的方法,其特征在于,所述使用所述完成训练的预测模型对待预测对象进行预测处理,包括:
将所述待预测对象输入至所述预测模型中,输出预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010760865.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示基板及其制备方法、掩膜版
- 下一篇:一种闭合装置及具有该装置的门窗、柜体