[发明专利]一种快速行人检测方法及装置有效
申请号: | 201810069322.X | 申请日: | 2018-01-24 |
公开(公告)号: | CN108399362B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 林倞;尹森堂;张冬雨;王青 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 广州容大知识产权代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 行人 检测 方法 装置 | ||
本发明公开了一种快速行人检测方法及装置,所述方法包括如下步骤:步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;步骤S2,输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图,本发明通过利用神经网络感知域的变化规律,使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果。
技术领域
本发明涉及行人检测技术领域,特别是涉及一种基于深度学习的面向嵌入式系统的快速行人检测方法及装置。
背景技术
作为计算机视觉中目标检测的一部分,行人检测在现实世界的应用有着重要意义,随着图像采集技术的成熟与存储技术成本的下降,越来越多的摄像机被部署在公共场所,另一方面,随着自动驾驶、智能交通的推行,车载摄像头也产生了海量的视频资源。传统的人工筛选和处理,不仅效率低下,耗费大量人力物力,而且可能引入一些人为因素,导致一些偏差。近年来,深度学习在计算机视觉领域取得前所未有的突破,不仅效率远胜人力,准确度在很多领域也超过人类。因此,有效利用深度学习的方法进行行人检测的课题备受关注。
人是视频监控或自动驾驶中最主要的目标之一,而行人检测的首要任务就是识别人体的存在,并提供相应的标注信息。由于在现实世界中捕捉到的图像质量参差不齐,对于小物体、遮挡的物体的检测一直是行人检测的难点,另一方面,车载摄像头也经常会捕捉到一些模糊的图像,这样的图像中也存在大量类似行人却不是行人的物体。而具体到嵌入式系统,由于识别能力强的大型神经网络模型通常难以有效率的运行在计算资源有限的嵌入式设备上,而对于嵌入式设备的应用需求又是实时的,因此兼顾检测准确率和效率是面向嵌入式系统的快速行人检测的重中之重。
发明内容
为克服上述现有技术存在的不足,本发明之一目的在于提供一种快速行人检测方法及装置,通过利用神经网络感知域的变化规律,使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果。
本发明之另一目的在于提供一种快速行人检测方法及装置,通过调整并训练VGG-16的网络得到适应嵌入式系统要求的squeeze VGG-16网络,有效降低了网络模型的参数量并加快了计算效率。
本发明之再一目的在于提供一种快速行人检测方法及装置,通过去卷积的方法对特定网络层的特征图进行放大,增强了对小物体的检测,相比于传统图片放大的方法,几乎不增加显存和计算量。
本发明之又一目的在于提供一种快速行人检测方法及装置,通过使用目标对象1.5倍大小的区域作为背景语义特征增加到网络中,对于模糊物体和远距离小物体的检测,有着极佳的性能。
为达上述及其它目的,本发明提出一种快速行人检测方法,包括如下步骤:
步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;
步骤S2,输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图。
优选地,步骤S1进一步包括:
构建可配置的基于卷积神经网络的深度模型;
输入训练样本;
初始化卷积神经网络及其参数,包括网络层中每层连接的权重和偏置;
采用前向传播算法和后向传播算法,利用训练样本学习出构建的网络参数,即用于测试过程的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810069322.X/2.html,转载请声明来源钻瓜专利网。