[发明专利]一种快速行人检测方法及装置有效

申请号：	201810069322.X	申请日：	2018-01-24
公开（公告）号：	CN108399362B	公开（公告）日：	2022-01-07
发明（设计）人：	林倞;尹森堂;张冬雨;王青	申请（专利权）人：	中山大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04
代理公司：	广州容大知识产权代理事务所(普通合伙) 44326	代理人：	刘新年
地址：	510000 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种快速行人检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种快速行人检测方法及装置，所述方法包括如下步骤：步骤S1，构建可配置的基于卷积神经网络的深度模型，利用训练样本学习出构建的网络参数，获得用于测试过程的模型；步骤S2，输入测试样本，通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测，预测出图像中目标物体的框图，本发明通过利用神经网络感知域的变化规律，使用不同的中间层对特定尺度范围内的目标物体进行检测，更好的适应了感知域与物体大小的关系，有效提高了检测结果。

技术领域

本发明涉及行人检测技术领域，特别是涉及一种基于深度学习的面向嵌入式系统的快速行人检测方法及装置。

背景技术

作为计算机视觉中目标检测的一部分，行人检测在现实世界的应用有着重要意义，随着图像采集技术的成熟与存储技术成本的下降，越来越多的摄像机被部署在公共场所，另一方面，随着自动驾驶、智能交通的推行，车载摄像头也产生了海量的视频资源。传统的人工筛选和处理，不仅效率低下，耗费大量人力物力，而且可能引入一些人为因素，导致一些偏差。近年来，深度学习在计算机视觉领域取得前所未有的突破，不仅效率远胜人力，准确度在很多领域也超过人类。因此，有效利用深度学习的方法进行行人检测的课题备受关注。

人是视频监控或自动驾驶中最主要的目标之一，而行人检测的首要任务就是识别人体的存在，并提供相应的标注信息。由于在现实世界中捕捉到的图像质量参差不齐，对于小物体、遮挡的物体的检测一直是行人检测的难点，另一方面，车载摄像头也经常会捕捉到一些模糊的图像，这样的图像中也存在大量类似行人却不是行人的物体。而具体到嵌入式系统，由于识别能力强的大型神经网络模型通常难以有效率的运行在计算资源有限的嵌入式设备上，而对于嵌入式设备的应用需求又是实时的，因此兼顾检测准确率和效率是面向嵌入式系统的快速行人检测的重中之重。

发明内容

为克服上述现有技术存在的不足，本发明之一目的在于提供一种快速行人检测方法及装置，通过利用神经网络感知域的变化规律，使用不同的中间层对特定尺度范围内的目标物体进行检测，更好的适应了感知域与物体大小的关系，有效提高了检测结果。

本发明之另一目的在于提供一种快速行人检测方法及装置，通过调整并训练VGG-16的网络得到适应嵌入式系统要求的squeeze VGG-16网络，有效降低了网络模型的参数量并加快了计算效率。

本发明之再一目的在于提供一种快速行人检测方法及装置，通过去卷积的方法对特定网络层的特征图进行放大，增强了对小物体的检测，相比于传统图片放大的方法，几乎不增加显存和计算量。

本发明之又一目的在于提供一种快速行人检测方法及装置，通过使用目标对象1.5倍大小的区域作为背景语义特征增加到网络中，对于模糊物体和远距离小物体的检测，有着极佳的性能。

为达上述及其它目的，本发明提出一种快速行人检测方法，包括如下步骤：

步骤S1，构建可配置的基于卷积神经网络的深度模型，利用训练样本学习出构建的网络参数，获得用于测试过程的模型；

步骤S2，输入测试样本，通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测，预测出图像中目标物体的框图。

优选地，步骤S1进一步包括：

构建可配置的基于卷积神经网络的深度模型；

输入训练样本；

初始化卷积神经网络及其参数，包括网络层中每层连接的权重和偏置；

采用前向传播算法和后向传播算法，利用训练样本学习出构建的网络参数，即用于测试过程的模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810069322.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于卷积神经网络CNN和语义分割的行人检测方法
下一篇：一种基于偏振图像的云检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种快速行人检测方法及装置有效

专利文献下载