[发明专利]一种基于深度学习的行人检测方法在审
申请号: | 201810082310.0 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108460336A | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 孙炜程;朱松豪;荆晓远;代心灵 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳;杜春秋 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 网络生成 特征图 决策树算法 提议 视频图像 输入区域 检测 准确率 学习 网络 | ||
1.一种基于深度学习的行人检测方法,其特征在于,包括以下步骤:
第一步、将待检测的视频图像输入提取网络生成特征图;
第二步、将提取网络生成的特征图输入区域提议网络,再利用区域提议方法检测最有可能是行人的区域,生成行人候选者以及行人候选者对应的分数;
第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。
2.根据权利要求1所述一种基于深度学习的行人检测方法,其特征在于: 所述提取网络采用PVANet网络,所述PVANet网络有十四层,其中前三层为卷积层,中间为两组起始层,每组起始层包含四个结构相同的起始层,最后三层为全连接层;所述全连接层的输出为区域提议网络以及决策树分类器的输入。
3.根据权利要求2所述一种基于深度学习的行人检测方法,其特征在于:单个起始层由第一、第二、第三分支组成,所述第一分支由一个1×1的卷积层组成,所述第二分支由一个1×1的卷积层和一个3×3的卷积层组成,所述第三分支由一个1×1的卷积层和两个3×3的卷积层组成。
4.根据权利要求3所述一种基于深度学习的行人检测方法,其特征在于, 单个起始层生成特征图的具体方法如下:上一层产生的特征图被分别传入起始层的三个分支,然后由这三个分支输出的特征图被传送至一连接层,最后进入下一层,成为下一层的输入特征图。
5.根据权利要求4所述一种基于深度学习的行人检测方法,其特征在于:在所述区域提议网络中,对于PVANet网络产生的输入特征图,将一个滑动窗口用到每一幅特征图上生成多个全连接的特征,每个全连接的特征包含两个分支,其中一个分支是scs层,另一个分支是cds层;所述cds层用来生成行人候选者,包括行人候选者中心点的坐标以及该行人候选者的宽度和高度;所述scs层用来生成行人候选者对应的分数;由cds层生成的行人候选者和由scs层生成的行人候选者对应的分数被输送到决策树分类器进行训练和检测。
6.根据权利要求5所述一种基于深度学习的行人检测方法,其特征在于:单个滑动窗口能够同时预测不同尺度和不同纵横比的区域提案。
7.根据权利要求6所述一种基于深度学习的行人检测方法,其特征在于:所述滑动窗口预测四个尺度和四个长宽比的区域提案时,会产生4*4个区域提案。
8.根据权利要求7所述一种基于深度学习的行人检测方法,其特征在于:所述滑动窗口在cds层产生4*4*4个输出,在scs层产生2*4*4个输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810082310.0/1.html,转载请声明来源钻瓜专利网。