[发明专利]一种弱监督目标检测方法及装置有效
申请号: | 201910507821.7 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110222704B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 张海涛;杜沛伦;马华东 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/46;G06V10/98;G06V10/774;G06V10/82;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 目标 检测 方法 装置 | ||
本发明实施例提供了一种弱监督目标检测方法及装置,提取待检测图像的图像特征;待检测图像中包含至少一个待检测物体;基于提取的图像特征,确定针对每个待检测物体的初始检测结果,每个初始检测结果为包含一个待检测物体的初始检测框;基于提取的图像特征,确定每个待检测物体的显著区域;基于每个显著区域,对每个初始检测结果进行优化,得到针对每个待检测物体的目标检测结果。相比于现有的若监督目标检测方法中,本发明不需要额外训练分割模型,而是将显著区域作为对检测结果优化的辅助信息,从而减少了目标检测任务的训练复杂度,且使用显著区域作为优化过程的辅助信息,能够避免优化方向出现错误,从而提高了训练效率。
技术领域
本发明涉及目标检测技术领域,特别是涉及一种弱监督目标检测方法及装置。
背景技术
近年来随着智慧城市和摄像技术的发展,目标检测任务越来越得到重视。目标检测指的是将图片中的不同物体均用矩形框框出来。
卷积神经网络作为深度神经网络的一个重要部分,能够有效的对图像特征进行提取,满足高精度目标检测的需求。然而,训练一个高准确率的检测模型需要大量的以包围框形式精细标注的图片数据作为模型监督条件,进行标注时需要花费大量的人力成本。随着近年来大数据的迅速发展,面对海量的视觉数据和越来越高的精度需求,基于人工标注的训练方法已经很难应用到实际的目标检测任务中。
为了减少人工标注,出现了弱监督目标检测技术。在弱监督条件下,仅需提供图片类别标注,不需要人为标注包围框,即可进行目标检测。
然而,现有的弱监督目标检测存在两个问题:
一:弱监督目标检测在迭代优化训练时需要较为精细的辅助特征信息,现有的弱监督目标检测中,需要额外训练一个图像的分割模型,用于为迭代优化提供辅助特征信息。因此,目标检测任务的训练复杂度较高。
二、现有的弱监督目标检测,在迭代优化训练时,会随机选择一个优化方向计算误差,错误的优化方向会使迭代训练失败,因此训练效率较低。
发明内容
本发明实施例的目的在于提供一种弱监督目标检测方法及装置,以实现降低目标检测任务的训练复杂度,并提高训练效率。具体技术方案如下:
为实现上述目的,本发明实施例提供了一种弱监督目标检测方法,所述方法包括:
提取待检测图像的图像特征;所述待检测图像中包含至少一个待检测物体;
基于提取的图像特征,确定针对每个待检测物体的初始检测结果,所述每个初始检测结果为包含一个待检测物体的初始检测框;
基于提取的图像特征,确定每个所述待检测物体的显著区域;
基于每个所述显著区域,对每个所述初始检测结果进行优化,得到针对每个待检测物体的目标检测结果。
可选的,所述基于提取的图像特征,确定每个所述待检测物体的显著区域的步骤,包括:
基于所述图像特征,确定针对每个待检测物体的特征激活图;
针对每个待检测物体,将该待检测物体的特征激活图中像素点大于预设阈值的区域,确定为显著区域。
可选的,所述基于每个所述显著区域,对每个所述初始检测结果进行优化,得到针对每个待检测物体的目标检测结果的步骤,包括:
将每个所述初始检测结果输入优化网络,得到针对每个待检测物体的目标检测结果,所述优化网络是根据样本数据训练得到的,所述样本数据包括:多个包含至少一个样本物体的样本图像,每个样本图像针对该样本图像中每个样本物体的初始样本检测结果,以及每个样本图像针对该样本图像中每个样本物体的样本显著区域。
可选的,所述优化网络按照如下方法训练:
获取预设的神经网络模型和所述训练集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910507821.7/2.html,转载请声明来源钻瓜专利网。