[发明专利]基于场景级与区域建议自注意模块的目标检测方法有效
申请号: | 201910790376.X | 申请日: | 2019-08-26 |
公开(公告)号: | CN110516670B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 李志欣;权宇;魏海洋;张灿龙 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/26;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 场景 区域 建议 注意 模块 目标 检测 方法 | ||
本发明公开一种基于场景级与区域建议自注意模块的目标检测方法,结合了多种先进的网络结构和理念,考虑到场景信息与语义信息对于视觉识别的重要性。首先构建深度可分离共享网络、场景级‑区域建议自注意模块与轻量化头部网络的目标检测模型;然后利用训练图像对目标检测模型进行训练,得到训练好的目标检测模型;最后将待测图像送入训练好的目标检测模型中,以获取图像中目标的位置信息与类别信息。本发明不仅仅局限于图像中目标物体的外观特征,而是将场景信息与物体之间的关系信息进行模型化特征提取处理,并根据结构预测出图像中的物体,从而能够大大提高检测的准确性。
技术领域
本发明涉及图像处理和计算机视觉技术领域,具体涉及一种基于场景级与区域建议自注意模块的目标检测方法。
背景技术
目标检测作为图像处理和计算机视觉领域中的经典课题,从理论发展到实践中的应用都在稳步提升。其作为计算机视觉领域的基石,关注的是检测特定的物体目标,并要求同时获得该目标的类别信息以及位置信息。它不同于分类任务将目标划分为单个类别,而是给出对目标前景和背景的理解,从背景中分离出感兴趣的目标,并确定该目标的描述(类别和位置)。此外,目标检测除了作为经典计算机视觉任务的基础元素,并在实例分割和目标跟踪工作上有很大的延展空间。
从2013年开始,Girshick等提出了R-CNN网路框架后,便成为计算机视觉领域利用深度学习研究目标检测的开山之作,其通过训练AlexNet深度网络对生成的RegionProposals进行特征提取,实现了候选区域的提取、特征提取与待检测类别的分离,可以在不同类别间实现共用。即使同时检测多类,也仅仅是倍增判别和精修两步,通过简单线性运算的方法为目标检测发展方向提供了新的思路。
继R-CNN之后,Girshick等在2015年推出Fast R-CNN,考虑到R-CNN存在训练分步太多、时间和内存消耗较大以及测试阶段时间较慢的几个问题,并针对以上三个问题做出针对性改进:首先,卷积操作不再是针对每一个Region Proposal进行,而是整张图像;其次,感兴趣区域池化层(Region of Interest Pooling,ROI pooling)接受的输入除了Region Proposal,还有卷积层5输出的Feature Map;另外,在ROI pooling后,作者采用奇异值分解(Singular Value Decomposition,SVD)来简化全连接层(fully connectedlayer,FC layer)的计算,整个目标检测网络相对R-CNN构思更精巧,流程更为紧凑,大幅提升了目标检测的速度。
经过了R-CNN和Fast R-CNN的积淀,Girshick等在2016年提出新的Faster R-CNN,该网络结构框架的提出使得基于深度学习的目标检测方法随后涌现出大批的优秀的改进版本。在结构上,Faster R-CNN将特征抽取(Feature Extraction)、候选区域(RegionProposals)提取、边框回归(Bounding Box Regression)以及分类(Classification)整合在一个网络框架中,除了使综合性能提升较大,特别是在检测速度方面尤为明显。
2017年底,何凯明基于以往的Faster R-CNN架构提出了新的卷积神经网络MaskR-CNN,并一举完成了目标实例分割(Object Instance Segmentation)和目标关键点检测,该算法的提出不仅有效的完成了目标检测,同时也实现了高质量的语义分割。简而言之,Mask R-CNN算法思想的实现实际上是在原始的Faster R-CNN算法基础上增加FCN产生对应的物体掩膜(Object Mask)分支。再进一步细化,则是Fast R-CNN网络结合RPN网络、区域特征聚集方式(ROIAlign)和FCN组成的一个新的网络架构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910790376.X/2.html,转载请声明来源钻瓜专利网。