[发明专利]基于多分支卷积神经网络的行人识别方法有效
申请号: | 202010345173.2 | 申请日: | 2020-04-27 |
公开(公告)号: | CN111582091B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 杨晨;张靖宇;陈琦;范世全;耿莉 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分支 卷积 神经网络 行人 识别 方法 | ||
1.基于多分支卷积神经网络的行人识别方法,其特征在于,包括以下步骤:
1)初始化多分支卷积神经网络;
2)边训练边筛选卷积核,作为构建块添加到各分支,构成精度和运算量可分离的多分支卷积神经网络;具体实现方法如下:
201)在初始化多分支卷积神经网络上,一边训练,一边从常用的卷积核1*1、3*3、5*5和7*7中,逐一筛选卷积核,作为构建单元,添加到分支架构;
202)由于行人识别为2分类任务,故构建单元添加方式为:第1分支添加1层构建单元,第2分支添加2层构建单元,第3分支添加3层构建单元;
3)设置时间监测点和精度预估值,验证精度,如果低于精度预估值,则返回步骤2),如果和预估值相差5%以内则停止,相差大于5%则集训训练;
4)继续训练,筛选多分支卷积神经网络的全连接层的超参数;
5)最后设计生成的模型,存储到移动摄像头的硬件处理架构中,离线推理其拍摄到的视频或者图像中是否有人出现。
2.根据权利要求1所述的基于多分支卷积神经网络的行人识别方法,其特征在于,还包括以下步骤:
6)将精度和计算量可分离的多分支卷积神经网络单独作为一个整体构建块可嵌入目标检测网络中,应用于车辆检测。
3.根据权利要求1或2所述的基于多分支卷积神经网络的行人识别方法,其特征在于,步骤1)的具体实现方法如下:
101)INRIA数据集为常用的行人识别数据集,该数据集包含两类格式的数据,正类别图片为分辨率为128×64×1的室外直立行人,负类别图片为分辨率为128×64×1的室外无直立行人的风景,由于数据集中负类别的图片较少,整体数据集较小,对此做了扩充,经由本文扩充之后的“INRIA扩展数据集”,包含训练集4339张图片,正类别样本2219张,负类别样本2120张;测试集400张图片,正类别样本200张,负类别样本200张;
102)行人识别数据集INRIA,首先直接初始化一个多分支卷积神经网络,这个架构不包含任何卷积层、池化层等单元。
4.根据权利要求3所述的基于多分支卷积神经网络的行人识别方法,其特征在于,步骤3)的具体实现方法如下:
逐一筛选到卷积核,进行训练之后,预先根据经验设立时间监测点和预估精度,每当训练到时间监测点,则暂停观察验证精度,如果达到预估精度,则停止训练;如果精度过低,则重复先前步骤。
5.根据权利要求4所述的基于多分支卷积神经网络的行人识别方法,其特征在于,步骤4)的具体实现方法如下:
训练达到预估精度,则筛选多分支卷积神经网络的全连接层;全连接层的参数,从常用参数64,128,256,512,1024、4096中逐一筛选,筛选出的参数按照梯度整理,加到每个分支,第1分支64,第2分支128,第3分支256。
6.根据权利要求5所述的基于多分支卷积神经网络的行人识别方法,其特征在于,步骤5)的具体实现方法如下:
筛选得到的多分支卷积神经网络,作为一个整体,或者取单个分支、两两分支组合作为单独的基准模型使用;即将模型拆分开来,同时应用于多种不同的移动终端设备;然后,根据存储的模型直接离线推理移动摄像头拍摄到的视频或者图像中是否有人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010345173.2/1.html,转载请声明来源钻瓜专利网。