[发明专利]一种基于两级注意力机制的行人检测方法及系统有效
申请号: | 201910260572.6 | 申请日: | 2019-04-02 |
公开(公告)号: | CN110135243B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 张重阳;罗艳 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T3/00 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银;刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 两级 注意力 机制 行人 检测 方法 系统 | ||
本发明公开了一种基于两级注意力机制的行人检测方法,将原始图像送入RPN模块得到目标候选框;将每一个候选框自上而下分为三个子区域;将子区域经过pool模块的特征分别送入一个第一级注意力模块,得到每一个子区域内相对精准的部位特征;将每一个候选框的部位特征与全局特征堆叠,送入一个第二级注意力模块,进行全局特征与部位特征的自适应加权;将两级注意力模块串联,得到端到端的检测网络模型。本发明有效去除复杂的背景干扰,适用于现实应用环境中多变的情况,增强检测鲁棒性,降低误检和漏检概率,尤其对于可用信息相对较少的被遮挡行人与冗余噪声干扰严重的小尺度行人,有效提高视频图像中行人目标的检测能力。
技术领域
本发明涉及的是一种图像中目标检测领域的方法,具体是一种基于两级注意力机制的行人检测方法及系统。
背景技术
大数据时代的到来,推动着计算机技术的不断更新和发展,行人检测技术作为计算机视觉领域的研究热点在智能视频监控、智能交通等领域表现出了重要的应用价值。现有的行人检测算法,因为尚存如下困难和挑战,检测结果还有待提升:由于拍摄距离原因,图片较大但目标行人尺寸较小,通过深度学习卷积神经网络降缩之后目标区域的特征很少,难以进行有效的检测识别;由于拍摄角度的固定性,行人的身体会出现部分遮挡问题,在检测过程中有用的信息相对减少,从而导致漏检的发生。
目前,较为成熟的行人检测算法基本可以分为两类:(1)基于背景建模。该方法主要用于视频中检测运动目标:即将输入的静态图像进行场景分割,利用混合高斯模型(GMM)或运动检测等方法,分割出其前景与背景,再在前景中提取特定运动目标。这类方法需要连续的图像序列来实现建模,不适合于单幅图像中的目标检测。(2)基于统计学习。即将所有已知属于行人目标的图像收集起来形成训练集,基于一个人工设计的算法(如HOG、Harr等)对训练集图像提取特征。提取的特征一般为目标的灰度、纹理、梯度直方图、边缘等信息。继而根据大量的训练样本的特征库来构建行人检测分类器。分类器一般可用SVM,Adaboost及神经网络等模型。
综合而言近年来基于统计学习的目标检测算法表现较优,基于统计学习的目标检测算法可以分为传统人工特征目标检测算法以及深度特征机器学习目标检测算法。
传统人工特征目标检测算法主要是指其利用人工设计的特征,来进行目标检测的建模。近年来表现优秀的人工设计的特征算法主要包括:2010年Pedro F.Felzenszwalb等提出的DPM(Deformable Part Model)算法(Object detection with discriminativelytrained part-based models)。Piotr Dollár等2009年提出的ICF(Integral ChannelFeatures)、2014年提出的ACF算法(Fast Feature Pyramids for Object Detection)。2014年Shanshan Zhang等提出的Informed Harr方法(Informed Haar-like FeaturesImprove Pedestrian Detection),致力于提取更加具有表征信息的Harr特征来进行训练。这些人工设计的特征虽然取得了一定的效果,但因为人工特征表征能力不足,仍存在检测精度不高问题。由于深度卷积神经网络模型所具有的更强大的特征学习与表达能力,在行人检测方面得到越来越广泛和成功的应用。基础的行人检测算子是R-CNN(Region-Convolutional Neural Network)模型。2014年,Girshick等人提出RCNN用于通用目标的检测,之后又是提出了Fast RCNN和Faster RCNN,提高了基于深度学习目标检测算法的精度和速度.2016年提出的Yolo和SSD等算法,则通过Anchor等思想实现单一阶段的快速目标检测。这些基于深度学习技术的目标检测,大都是使用从整个候选框提取的特征进行分类回归,仍然存在深度特征提取不充分的问题,尤其是针对行人中的遮挡目标以及小尺寸目标,一方面由于遮挡目标身体部分部位的不可见性,视觉特征有限;另一方面是因为深度卷积神经网络层层的尺寸降缩,特征尺寸更小;这两方面的因素导致行人目标的检测精度不高、漏检率需要进一步降低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910260572.6/2.html,转载请声明来源钻瓜专利网。