[发明专利]目标检测方法、装置、计算机设备和存储介质在审
申请号: | 202010166856.1 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111292377A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 赵博睿;魏秀参;陈钊民 | 申请(专利权)人: | 南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06K9/62 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 孙岩 |
地址: | 210038 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种目标检测方法、装置、计算机设备和存储介质。其中,该方法包括:对待检测图像进行多尺度特征提取,得到多个不同尺度的特征图;确定多个不同尺度的特征图中空间分辨率符合预设条件的目标特征图;对目标特征图进行降维,得到降维后的目标特征图;将降维后的目标特征图输入全连接网络,得到层级信息特征;根据多个不同尺度的特征图和层级信息特征进行目标检测,得到待检测图像中目标的类别信息和位置信息。本申请通过在目标检测过程中添加层级信息特征,可有效改善分类特征,从而提高了目标检测的准确性。
技术领域
本申请涉及图像数据处理技术领域,特别是涉及一种目标检测方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,目标检测作为计算机视觉中最基本和首要的任务之一,广泛应用于工业界和日常生活的各个方面,例如自动驾驶、安防监控以及游戏娱乐等领域。
传统技术中,目标检测方法先通过卷积神经网络来预测边界框,然后再通过一次神经网络对该边界框进行微调以进一步改善边界框的质量,由此提高了边界框的精确性。
然而,采用传统的目标检测方法,在对边界框中的目标进行检测时,准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高目标检测准确性的目标检测方法、装置、计算机设备和存储介质。
一种目标检测方法,所述方法包括:
对待检测图像进行多尺度特征提取,得到多个不同尺度的特征图;
确定所述多个不同尺度的特征图中空间分辨率符合预设条件的目标特征图;
对所述目标特征图进行降维,得到降维后的目标特征图;
将所述降维后的目标特征图输入全连接网络,得到层级信息特征;
根据所述多个不同尺度的特征图和所述层级信息特征进行目标检测,得到所述待检测图像中目标的类别信息和位置信息。
在其中一个实施例中,对所述目标特征图进行降维,得到降维后的目标特征图,包括:
对所述目标特征图进行全局最大池化,得到第一池化特征;
对所述目标特征图进行全局平均池化,得到第二池化特征;
将所述第一池化特征和所述第二池化特征相加或拼接,得到所述降维后的目标特征图。
在其中一个实施例中,根据所述多个不同尺度的特征图和所述层级信息特征进行目标检测,得到所述待检测图像中目标的类别信息和位置信息,包括:
根据所述多个不同尺度的特征图和所述层级信息特征,得到层级信息特征图;
在所述层级信息特征图中确定候选区域,对所述候选区域进行池化操作以提取所述待检测图像中目标的特征;
将所述待检测图像中目标的特征输入全连接网络,得到所述待检测图像中目标的类别信息和位置信息。
在其中一个实施例中,根据所述多个不同尺度的特征图和所述层级信息特征,得到层级信息特征图,包括:
将所述多个不同尺度的特征图和所述层级信息特征进行融合,得到层级信息特征图。
在其中一个实施例中,所述层级信息特征包括层级类别。
在其中一个实施例中,将所述降维后的目标特征图输入全连接网络,得到层级信息特征,包括:
对所述降维后的目标特征图进行全连接,得到多维度向量;
根据所述多维度向量中的元素,确定每一类别的置信度分数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司,未经南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010166856.1/2.html,转载请声明来源钻瓜专利网。