[发明专利]基于深度强化学习的Faster-RCNN目标物体检测方法有效
申请号: | 202010269277.X | 申请日: | 2020-04-08 |
公开(公告)号: | CN111476302B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 于重重;杨鑫;王鑫;冯文彬 | 申请(专利权)人: | 北京工商大学;煤科集团沈阳研究院有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/25;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 faster rcnn 目标 物体 检测 方法 | ||
本发明公布了一种基于深度强化学习的Faster‑RCNN目标物体检测方法,采用深度强化学习的经验池保存每个时刻的区域建议网络RPN的状态,采用卷积门控循环单元输出两个动作,采用随机策略选择执行相应的动作,同时采用自定义的非极大值抑制方法去除冗余的检测框,获得与标注框最接近的检测框;采用分类网络对检测框进行分类,对检测框进行二次回归,实现对目标物体的检测与识别。采用本发明技术方案,目标定位准确,目标检测精度高。
技术领域
本发明属于计算机视觉技术领域,涉及目标检测与识别技术,具体涉及一种基于深度强化学习的Faster-RCNN目标物体检测方法。
背景技术
目标物体检测是找出图像中所有感兴趣的目标,并确定它们的位置和大小,是计算机视觉领域的核心问题之一。由于各类物体具有不同的外观、形状、姿态,以及成像时光照、遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。随着深度学习在图像分类任务上取得巨大进展,基于深度学习的目标检测算法逐渐成为主流。
基于深度学习的目标检测方法主要分为One-stage和Two-stage两种。One-stage方法是一次性生成检测框和分类预测,牺牲一定的精度来换取更快的检测速度。Two-stage方法是先生成检测框,然后进行分类,牺牲一定的速度来换取更高的精度。为了保证较高的检测精度,以及生成区域建议和与其相应的视觉特征表示,大多数现有方法采用Two-stage方法。一般情况下,Two-stage方法是首先采用区域生成网络(Region Proposal Network,RPN)结构生成感兴趣区域,然后对感兴趣区域进行分类,并且微调它们的定位精度。
区域生成网络在提取感兴趣区域时,优先选择分类得分较高的感兴趣区域,但是同时会生成很多与分类得分重叠(Intersection Over Union,IOU)较多的感兴趣区域,即冗余的检测框。非极大值抑制(Non Maximum Suppression,NMS)算法就是为去除检测算法中冗余检测框而设计的。经典的非极大值抑制算法基于分类分数保留高分的检测框,但是大多数情况下,重叠度IOU与分类分数不是强相关,导致很多分类得分高的检测框检测不准确。
2017年,Bodla N等提出了Soft-NMS算法,对传统的非极大值抑制算法进行了简单的改进且不增加额外的参数。在该算法中,基于重叠部分的大小为相邻检测框设置一个衰减函数而非彻底将其分数置为零。(Bodla N,Singh B,Chellappa R,et al.ImprovingObject Detection With One Line of Code[J].2017.)
He Y等提出了Softer-NMS算法,引入了一个反映其定位精准度的因变量。传统的Two-stage检测器进行非极大值抑制时用到的得分仅仅是分类得分,不能反映候选包围框的定位精准度。Soft-NMS和Softer-NMS算法都是通过新的置信度方法来改进非极大值抑制。(He Y,Zhang X,Savvides M,et al.Softer-nms:Rethinking bounding boxregression for accurate object detection[J].arXiv preprint arXiv:1809.08545,2018.)
Cai Z等提出了Cascade R-CNN,通过使用不同的重叠度阈值,训练了多个级联的检测器。(Cai Z,Vasconcelos N.Cascade R-CNN:Delving into High Quality ObjectDetection[J].2017.)
以上这些方法都是为了去除检测算法中冗余的检测框,但是区域生成网络等方法在提取感兴趣区域时生成的检测框数量多、不精确,非极大值抑制贪婪地选择候选区域从而导致检测精度低。因此,实现更精准的目标检测仍是一项极具挑战性的技术任务。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;煤科集团沈阳研究院有限公司,未经北京工商大学;煤科集团沈阳研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269277.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:关于造价业务专业化分工协作落地操作方案
- 下一篇:一种胶囊分拣装置