[发明专利]一种基于区域全卷积神经网络的人体目标检测方法有效
申请号: | 201710193100.4 | 申请日: | 2017-03-28 |
公开(公告)号: | CN106874894B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 邹见效;周雪;徐红兵;刘鹏飞 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/42;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区域 卷积 神经网络 人体 目标 检测 方法 | ||
本发明公开了一种基于区域全卷积神经网络的人体目标检测方法,标定人体目标上半身即人体头肩模型位置为标定框,这样减少了人体目标被遮挡的概率,减小了漏检率;同时,设定不同的五个图像尺度进行转换,以及选用{0.8,1.2}两个不同比例的宽高比和{48,96,144,192,240}五个不同比例尺度作为生成anchors的规则,进一步减小了漏检率。此外,本发明还通过计算一幅人体目标图像各区域候选框损失值,并选取损失值最大前B区域候选框作为难例样本,其损失值反馈到区域全卷积神经网络模型中,使用随机梯度下降法更新区域全卷积神经网络模型的参数,以提高复杂场景下的人体目标检测的准确率,减少漏检率和误检率。
技术领域
本发明属于计算机视觉、模式识别、机器学习等技术领域,更为具体地讲,涉及在监控场景下一种基于区域全卷积神经网络的人体目标检测方法。
背景技术
近年来,随着科技的进步,各个行业开始越来越关注安全问题。在银行、机场、地铁、车站、小区等重要区域以及公共场所,人们都安装了监控摄像头进行视频监控。这些监控摄像头一般都安装在较高的位置,以俯视的角度进行监控。而我们所说的监控场景即是指在这种情景下拍摄的监控画面。
一般情况下,人是监控场景的主体,对人体目标的跟踪和后续的行为识别分析严重依赖于人体目标检测的精度,因此如何在监控场景下准确检测人体目标已经成为学术界和工业界广泛关注的热点之一。
早期的研究者一般将人体目标检测问题分为两个步骤来解决,首先是基于手工设计的模型进行特征提取,然后基于目标特征设计分类器训练检测模型。比如,Viola和Jones将采用haar小波特征,结合adaboost级联分类器的VJ模型应用于人体目标检测中。具体算法原理参见:Viola P,Jones M J,Snow D.Detecting pedestrians using patterns ofmotion and appearance[C].Computer Vision,2003.Proceedings.Ninth IEEEInternational Conference on.IEEE,2003:734-741。Dalal N与Triggs B提出了一种基于梯度直方图(Histograms of Oriented Gradients,HOG)特征和支持向量机(SupportVector Machine,SVM)框架的人体目标检测方法,具体算法原理参见:Dalal N,TriggsB.Histograms of oriented gradients for human detection[C].Computer Vision andPattern Recognition,2005.CVPR 2005.IEEE Computer Society Conference on.IEEE,2005,1:886-893。这些方法在简单监控场景下对人体目标检测取得了较好的结果,但是对于复杂的监控场景下的人体目标检测结果还是不能满足我们的实际需求。
随着最近几年深度学习的兴起,基于深度学习的方法在图像分类领域取得了优异的成绩。很多研究者基于此也尝试将深度学习应用于目标检测领域。Ren,Shaoqing提出了一种快速区域卷积神经网络(Faster r-cnn)的方法,将人体目标检测问题分为三个阶段,首先是获取人体目标区域候选框,然后是使用卷积神经网络进行目标特征提取,最后目标特征进行分类训练得到模型。相较于传统的人体目标检测方法,提高了57%的检测准确率。具体算法原理可以参见文献:Ren,Shaoqing,et al.Faster r-cnn:Towards real-timeobject detection with region proposal networks.Advances in neuralinformation processing systems.2015。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710193100.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试卷分数的统计方法及系统
- 下一篇:一种视线追踪装置及头戴式显示设备