[发明专利]一种基于卷积神经网络进行目标检测的方法有效
申请号: | 202010244313.7 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461145B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 唐乾坤;胡瑜 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/766;G06V10/80;G06V10/44;G06V10/82;G06N3/0464;G06N3/047 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 进行 目标 检测 方法 | ||
本发明提供一种基于卷积神经网络进行的目标检测方法,包括:提取特征图并设置若干不同的预设框;将所述预设框进行回归以调整其位置和大小;基于所述回归后的预设框提取其对应的局部卷积特征;将所述局部卷积特征输入卷积预测器进行分类和回归,获得目标的边界框位置和目标的类别,其中,所述卷积预测器是通过将所述预设框进行分类并选择正例预设框来训练获得。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于卷积神经网络进行目标检测的方法。
背景技术
目标检测作为计算机视觉中的一个重要组成部分,其目的是从复杂的背景中识别出目标的类别并给出目标在图像中的位置信息,为后续目标追踪、情景理解等任务提供基础。目标检测技术对检测的精确性和实时性都有较高的要求,被广泛应用于自动驾驶、智能监控、增强现实、人脸识别、计算机辅助医疗以及军事国防等各个尖端领域。
现有的基于深度学习的目标检测方法主要包括基于候选区域的两阶段检测和基于回归的单阶段检测两种,两种方法各有优缺点。基于候选区域的目标检测方法,例如R-CNN、Fast R-CNN、Faster-RCNN、R-FCN以及Mask R-CNN等,是首先使用一个推荐区域(region proposal)网络来生成感兴趣区域(region of interest),然后通过全连接层或者位置敏感卷积层对感兴趣区域进行分类。该方法虽然能获得较高的检测精度,但是需要较长的运行时间,在运算速度上无法达到实时性。基于回归的单阶段目标检测方法,例如YOLO、SSD等,通过使用回归的思想大幅提高了运行速度,但是其检测精度不及Faster-RCNN等两阶段目标检测方法。
因此,亟需一种目标检测方法使得在检测速度和检测准确方面达到平衡。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种基于卷积神经网络进行的目标检测方法,包括:提取特征图并设置若干不同的预设框;将所述预设框进行回归以调整其位置和大小;基于所述回归后的预设框提取其对应的局部卷积特征;将所述局部卷积特征输入卷积预测器进行分类和回归,获得目标的边界框位置和目标的类别,其中,所述卷积预测器是通过将所述预设框进行分类并选择正例预设框来训练获得。
可选的,其中,所述正例预设框包括:预设框与真实目标框之间的重叠率IOU大于预设的阈值的预设框,其中其中,d表示预设框,g表示真实的目标边界框,Sd表示预设框的面积,Sg表示真实的目标边界框的面积。
可选的,上述方法还包括:将所述特征图进行特征融合;为融合后的特征图设置若干不同的预设框。
可选的,其中,所述特征融合包括相邻特征融合。
可选的,上述方法还包括:采用级联卷积网络提取特征图。
可选的,其中,将所述预设框进行回归以调整其位置和大小包括:基于真实的目标边界框的中心点的位置调整所述预设框的中心点的位置;基于所述真实的目标边界框的大小调整所述预设框的宽和高;基于所述预设框的中心点位置以及宽和高的调整信息确定回归后的预设框的位置和大小。
可选的,其中,所述基于所述回归后的预设框提取其对应的局部卷积特征包括:根据所述回归后的预设框的位置的调整信息确定卷积核的整体偏移量;根据所述回归后的预设框的大小的调整信息确定所述卷积核中每个卷积单元的偏移量;根据所述卷积核的整体偏移量和所述每个卷积单元的偏移量确定卷积核卷积位置;基于所述卷积核的卷积位置提取回归后的预设框对应的局部卷积特征。
可选的,上述方法还包括:采用非极大值抑制算法优化检测结果。
可选的,其中,所述非极大值抑制算法包括:将各个边界框按照置信度从大到小排序;选择置信度最高的边界框作为输出边界框,并将其从边界框列表中删除;计算所有边界框的面积;计算该输出边界框与其他边界框的IOU;删除IOU大于指定阈值的边界框;重复上述过程,直至边界框列表为空。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010244313.7/2.html,转载请声明来源钻瓜专利网。