[发明专利]一种基于深度学习的行人检测方法在审

申请号：	201810082310.0	申请日：	2018-01-29
公开（公告）号：	CN108460336A	公开（公告）日：	2018-08-28
发明（设计）人：	孙炜程;朱松豪;荆晓远;代心灵	申请（专利权）人：	南京邮电大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04
代理公司：	南京苏科专利代理有限责任公司 32102	代理人：	姚姣阳;杜春秋
地址：	210023 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	行人检测网络生成特征图决策树算法提议视频图像输入区域检测准确率学习网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的行人检测方法，其特征在于，包括以下步骤：

第一步、将待检测的视频图像输入提取网络生成特征图；

第二步、将提取网络生成的特征图输入区域提议网络，再利用区域提议方法检测最有可能是行人的区域，生成行人候选者以及行人候选者对应的分数；

第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。

2.根据权利要求1所述一种基于深度学习的行人检测方法，其特征在于: 所述提取网络采用PVANet网络，所述PVANet网络有十四层，其中前三层为卷积层，中间为两组起始层，每组起始层包含四个结构相同的起始层，最后三层为全连接层；所述全连接层的输出为区域提议网络以及决策树分类器的输入。

3.根据权利要求2所述一种基于深度学习的行人检测方法，其特征在于:单个起始层由第一、第二、第三分支组成，所述第一分支由一个1×1的卷积层组成，所述第二分支由一个1×1的卷积层和一个3×3的卷积层组成，所述第三分支由一个1×1的卷积层和两个3×3的卷积层组成。

4.根据权利要求3所述一种基于深度学习的行人检测方法，其特征在于，单个起始层生成特征图的具体方法如下：上一层产生的特征图被分别传入起始层的三个分支，然后由这三个分支输出的特征图被传送至一连接层，最后进入下一层，成为下一层的输入特征图。

5.根据权利要求4所述一种基于深度学习的行人检测方法，其特征在于：在所述区域提议网络中，对于PVANet网络产生的输入特征图，将一个滑动窗口用到每一幅特征图上生成多个全连接的特征，每个全连接的特征包含两个分支，其中一个分支是scs层，另一个分支是cds层；所述cds层用来生成行人候选者，包括行人候选者中心点的坐标以及该行人候选者的宽度和高度；所述scs层用来生成行人候选者对应的分数；由cds层生成的行人候选者和由scs层生成的行人候选者对应的分数被输送到决策树分类器进行训练和检测。

6.根据权利要求5所述一种基于深度学习的行人检测方法，其特征在于：单个滑动窗口能够同时预测不同尺度和不同纵横比的区域提案。

7.根据权利要求6所述一种基于深度学习的行人检测方法，其特征在于：所述滑动窗口预测四个尺度和四个长宽比的区域提案时，会产生4*4个区域提案。

8.根据权利要求7所述一种基于深度学习的行人检测方法，其特征在于：所述滑动窗口在cds层产生4*4*4个输出，在scs层产生2*4*4个输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810082310.0/1.html，转载请声明来源钻瓜专利网。

上一篇：视频细粒度识别方法、装置、计算机设备及存储介质
下一篇：基于自适应云模型的大雾场景空中图像融合识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的行人检测方法在审

专利文献下载