[发明专利]基于卷积神经网络的物体检测方法及装置有效
申请号: | 201811628757.X | 申请日: | 2018-12-28 |
公开(公告)号: | CN110309842B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 贾纪元;周莉;陈杰 | 申请(专利权)人: | 中国科学院微电子研究所 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/80;G06V10/778;G06V10/774 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 物体 检测 方法 装置 | ||
本发明公开了一种基于卷积神经网络的物体检测方法及装置,该方法包括:获取含有物体的图片,输入卷积神经网络,得到卷积特征图;将卷积特征图聚合得到通道信息聚合图;并根据感兴趣区域位置坐标产生区域重聚焦矩阵;根据区域重聚焦矩阵结合卷积特征图对卷积神经网络进行训练,直至网络的物体检测精度收敛。本发明提供的基于卷积神经网络的物体检测方法及装置通过教师‑学生模式的训练方法训练实现,根据区域重聚焦矩阵中不同位置元素值的大小去动态地缩放惩罚学生网络和教师网络特征图之间的差异损失,促使学生网络学习更加合理的特征表达,从而训练出更加精确的单阶段物体检测神经网络。
技术领域
本发明涉及计算机视觉中的物体检测领域,尤其涉及一种基于卷积神经网络的物体检测方法及装置。
背景技术
将深度卷积神经网络应用于物体检测领域,可以大幅的提高检测精度与模型的泛化性能。物体检测任务的目标为,给定一张含有物体的图片,模型自动识别出图片中所有的物体,针对图片中出现的每一个物体,模型会预测出其类别信息和类别置信度,以及其所在边界框的位置坐标。
基于深度卷积神经网络的物体检测模型,其精度相比传统方法有显著的提升。基于深度卷积神经网络的物体检测器可分为单阶段与二阶段两大类,其中单阶段物体检测神经网络(例如YOLO网络)在精度和运算速度之间具有良好的平衡,被广泛应用于车载、安防等对实时性要求较高的领域。
网络规模较大的单阶段物体检测神经网络往往具有较高的计算复杂度和存储消耗,不便于将其部署在低端的计算平台上;因此,网络规模小,运算快的小型单阶段物体检测神经网络更加适合于在实际应用中的部署。然而,小型的单阶段物体检测神经网络存在训练不易收敛、精度低等问题,因此,如何改善小型单阶段物体检测神经网络的训练收敛状况和提高其检测精度是十分重要的话题。
发明内容
本发明的目的在于提供一种基于卷积神经网络的物体检测方法及装置,以加快物体检测神经网络的训练收敛速度,并提高其检测精度。
为了实现上述目的,本发明提供了一种基于卷积神经网络的物体检测方法,包括:
获取含物体的图片,将该图片经数据扩增处理后输入至教师网络进行前向运算,得到具有不同通道特征信息的卷积特征图,该教师网络为能够独立完成物体检测的卷积神经网络;
进一步的,卷积特征图为含有不同维度的张量,该维度包括:高度、宽度和通道。
对上述卷积特征图进行聚合处理,得到通道信息聚合图;
进一步的,该步骤包括:
在教师网络的卷积特征图通道方向上,融合不同通道的语义信息,将不同通道特征信息聚合压缩为单通道矩阵,得到通道信息聚合图。
根据感兴趣区域位置坐标,结合上述通道信息聚合图,产生区域重聚焦矩阵;
进一步的,该步骤包括:
根据感兴趣区域的位置坐标,对通道信息聚合图裁剪出相应感兴趣区域的区域重聚焦矩阵,该区域重聚焦矩阵编码了感兴趣区域内不同位置的重要程度;
更进一步的,产生区域重聚焦矩阵的计算公式为:
其中,mi,j∈S表示所生成的区域重聚焦矩阵中一个像素的值,i,j,k表示在三维的卷积特征图中一个像素的空间坐标,pi,j,k表示三维卷积特征图中某位置处的激活值,C代表三维卷积特征图的通道数,S表示某个感兴趣区域,T表示规范化因子。
上述含物体的图片,进行相同的数据扩增处理后,同时输入学生网络进行前向运算得到卷积特征图,该学生网络为规模小于教师网络的卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院微电子研究所,未经中国科学院微电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811628757.X/2.html,转载请声明来源钻瓜专利网。