[发明专利]一种物体检测模型训练、物体检测方法及装置有效
申请号: | 202010170904.4 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111353464B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 孙培泽;张弘楷;李伯勋;俞刚;张弛 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/25;G06V10/764;G06V10/82;G06N3/084 |
代理公司: | 北京隆源天恒知识产权代理有限公司 11473 | 代理人: | 陈雪飞 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物体 检测 模型 训练 方法 装置 | ||
本发明提供了一种物体检测模型训练、物体检测方法及装置,涉及机器学习技术领域,包括:将训练图像输入所述检测模型中,确定所述训练图像的前景点预测值;确定所述前景点预测值对所述训练图像的梯度;判断所述梯度是否满足预设条件;当若不满足所述预设条件时,则根据所述梯度在所述训练图像的背景点位置的值对所述检测模型的网络参数的梯度,来更新所述网络参数,直至满足所述预设条件或达到预设训练次数,得到训练后的完成对所述检测模型的训练。本发明通过判断前景点预测值对输入图像的梯度是否在前景点像素范围之内,来更新网络参数。通过增加物体检测场景中对前景梯度的约束,可加快训练收敛速度,并有效提高对物体检测的性能。
技术领域
本发明涉及机器学习技术领域,具体而言,涉及一种物体检测模型训练、物体检测方法及装置。
背景技术
随着机器学习和计算机视觉技术的不断发展,物体检测在计算机视觉与模式识別领域,已成为一个比较热门的研究方向。物体检测对于计算机而言,其所要面对的是图片的像素矩阵,很难直接得到物体的名称和其在目标图像中的位置,再加上物体姿态的各异、光照强弱不一以及各种背景的混杂和相互遮挡的干扰,使得基于计算机视觉的物体检测任务变得更加的困难。
现有的对物体检测模型进行训练的方法大多基于梯度下降算法,即根据误差函数对网络参数的导数(即梯度)来更新网络参数,但是存在训练时间较长的问题,训练效果也有提高的空间。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题,为达上述目的,本发明第一方面的实施例提供了一种检测模型训练方法,其包括:
将训练图像输入所述物体检测模型中,确定所述训练图像的前景点预测值;
确定所述前景点预测值对所述训练图像的梯度;
判断所述梯度是否满足预设误差约束条件;
当不满足所述预设误差约束条件时,根据所述梯度在所述训练图像的背景点位置的值对所述物体检测模型的网络参数的梯度,来更新所述网络参数,直至满足收敛条件或达到预设训练次数,得到训练后的所述物体检测模型。
进一步地,所述确定所述训练图像的前景点预测值包括:将所述训练图像中物体检测框内的位置对应像素的输出结果确定为所述前景点预测值。
进一步地,所述确定所述前景点预测值对所述训练图像的梯度包括:将所述物体检测模型的误差函数在所述训练图像的前景点位置的值对所述训练图像的梯度确定为所述梯度。
进一步地,所述梯度与所述训练图像的大小相同,所述训练图像中的前景点位置为所述梯度中对应的前景点位置,所述训练图像中的背景点位置为所述梯度中对应的背景点位置。
进一步地,所述预设误差约束条件为所述梯度在所述训练图像的物体检测框范围之内。
进一步地,述预设误差约束条件为所述梯度在所述训练图像的背景点位置的值为0。
进一步地,所述根据所述梯度在所述训练图像的背景点位置的值对所述物体检测模型的网络参数的梯度来更新所述网络参数包括:
根据所述梯度和所述训练图像的背景点掩膜确定所述梯度在所述训练图像的背景点位置的值;
根据所述梯度在所述训练图像的背景点位置的值对所述网络参数求导得到二阶梯度;
根据所述二阶梯度对所述网络参数进行更新。
进一步地,所述物体检测模型包括单级、双级和级联级检测模型。
为达上述目的,本发明第二方面的实施例还提供了一种物体检测模型训练装置,其包括:
获取模块,用于将训练图像输入所述物体检测模型中,确定所述训练图像的前景点预测值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010170904.4/2.html,转载请声明来源钻瓜专利网。