[发明专利]一种目标检测模型学习率的设置方法和装置在审
申请号: | 201910919042.8 | 申请日: | 2019-09-26 |
公开(公告)号: | CN112560883A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 罗壮;何云龙;赵亚滨;郭晓辉;张志强 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 模型 学习 设置 方法 装置 | ||
本发明公开了目标检测模型学习率的设置方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;再以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数;其中,基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率。从而,本发明的实施方式能够解决现有技术训练目标检测模型的学习率设置效率低的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种目标检测模型学习率的设置方法和装置。
背景技术
在训练目标检测模型过程中,通过随机梯度下降以及反向传播机制不断减小损失函数值,从而使预测框的位置逼近真实框的位置,同时提高类别置信度,不断增强模型检测目标的效果。最终得到一个最优的目标检测模型。而学习率是训练目标检测模型重要的超参数,设置学习率时,首先需要确定初始值,训练过程中还需要不断调整,而这两步都影响着最后的模型检测效果。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
目前,最优的学习率初始值与数据集具有一定联系,找到最优的学习率初始值需要多次尝试调整。另外,训练过程中学习率的调整策略会影响最后的模型效果,调整的时机和程度不易把握。现实中往往需要进行多次无效训练尝试才能设置出合适的学习率调整方案。
发明内容
有鉴于此,本发明实施例提供一种目标检测模型学习率的设置方法和装置,能够解决现有技术训练目标检测模型的学习率设置效率低的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种目标检测模型学习率的设置方法,包括设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。
可选地,获得最小学习率和最大学习率,包括:
根据验证集的平均精度均值脱离趋近于0的区域开始增大时,获得最小学习率;
根据验证集的平均精度均值开始降低时,获得最大学习率。
可选地,以预设数量个步长为一个周期循环训练目标检测模型,包括:
以2个步长为一个周期循环训练目标检测模型;其中,在第一个步长期间,学习率由最小学习率逐渐增大到最大学习率;在第二个步长期间,学习率由最大学习率逐渐减小到最小学习率。
可选地,基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,包括:
在第一个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以步长内当前迭代的次数与步长的商,再加上最小学习率;
在第二个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以,步长与步长内当前迭代的次数的差再除以步长的结果,最后再加上最小学习率
另外,根据本发明实施例的一个方面,提供了一种目标检测模型学习率的设置装置,包括设置模块,用于设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;处理模块,用于初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910919042.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:负载型催化剂及其制备方法和应用
- 下一篇:分子筛催化剂及其制备方法与应用