[发明专利]图像检测模型的训练方法及装置、目标检测方法及装置有效
申请号: | 201811320550.6 | 申请日: | 2018-11-07 |
公开(公告)号: | CN111160379B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 张修宝;田万鑫;沈海峰 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/084;G06N3/045 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检测 模型 训练 方法 装置 目标 | ||
1.一种图像检测模型的训练方法,其特征在于,所述方法包括:
将目标训练图像输入初始模型;所述初始模型包括依次连接的骨干网络和头网络,所述头网络包括并行的分类子网络、回归子网络和掩码子网络;所述目标训练图像携带有类别标签、回归标签和掩码标签;所述分类子网络、所述回归子网络和所述掩码子网络的前部预设数量的卷积层的参数共享;
通过所述骨干网络提取所述目标训练图像的特征响应图;
通过所述分类子网络对所述特征响应图进行分类处理,并基于分类处理结果与所述类别标签计算得到分类损失值;
通过所述回归子网络对所述特征响应图进行回归处理,并基于回归处理结果与所述回归标签计算得到回归损失值;
通过所述掩码子网络对所述特征响应图进行掩码处理,并基于掩码处理结果与所述掩码标签计算得到掩码损失值;所述掩码处理包括将所述特征响应图中的非目标所在区域进行遮掩处理;
基于所述分类损失值、所述回归损失值和所述掩码损失值对所述初始模型进行训练,得到目标检测模型;其中,所述目标检测模型为用于对图像中的目标进行检测的模型,且所述目标检测模型包括训练后的所述骨干网络、所述分类子网络和所述回归子网络。
2.如权利要求1所述的方法,其特征在于,所述骨干网络包括残差网络和特征金字塔网络;
通过骨干网络提取所述目标训练图像的特征响应图的步骤,包括:
通过所述残差网络提取所述目标训练图像的多种尺度的特征图;
将多种尺度的特征图分别输入至所述特征金字塔网络的多个网络层;其中,每个所述网络层对应输入一种尺度的特征图;
通过所述特征金字塔网络的每个网络层对输入的所述特征图进行特征融合处理,得到对应的特征响应图;其中,不同网络层输出的特征响应图对应的感受野不同。
3.如权利要求2所述的方法,其特征在于,所述特征金字塔网络的网络层至少为4层。
4.如权利要求2所述的方法,其特征在于,所述特征金字塔网络的每个网络层分别与并行的所述分类子网络、所述回归子网络和所述掩码子网络相连;
所述通过所述分类子网络对所述特征响应图进行分类处理的步骤,包括:通过所述分类子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行分类处理;
所述通过所述回归子网络对所述特征响应图进行分类处理的步骤,包括:通过所述回归子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行回归处理;
所述通过所述掩码子网络对所述特征响应图进行掩码处理的步骤,包括:通过所述掩码子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行掩码处理。
5.如权利要求4所述的方法,其特征在于,所述掩码标签为多种;每种所述掩码标签对应一种尺度的所述特征图;
基于掩码处理结果与所述掩码标签计算得到掩码损失函数值的步骤,包括:
根据与所述掩码子网络连接的所述特征金字塔网络的网络层,获取与所述掩码子网络对应的掩码标签;
基于所述掩码子网络的掩码处理结果与获取的所述掩码标签计算得到掩码损失函数值。
6.如权利要求1所述的方法,其特征在于,基于掩码处理结果与所述掩码标签计算得到掩码损失值的步骤,包括:将掩码处理结果与所述掩码标签代入至交叉熵损失函数中,计算得到掩码损失值。
7.如权利要求6所述的方法,其特征在于,所述交叉熵损失函数为Sigmoid函数。
8.如权利要求1所述的方法,其特征在于,所述基于所述分类损失值、所述回归损失值和所述掩码损失值对所述初始模型进行训练的步骤,包括:
采用反向传播算法,基于所述分类损失值、所述回归损失值和所述掩码损失值对所述骨干网络、所述分类子网络、所述回归子网络和所述掩码子网络进行联合训练,直至所述分类损失值收敛到第一预设值,所述回归损失值收敛到第二预设值,所述掩码损失值收敛到第三预设值时停止训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811320550.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种断句方法及装置
- 下一篇:自动导航云服务器及自动导航控制方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序