[发明专利]一种基于深度学习的人车自动分类方法在审
申请号: | 201711119313.9 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107862291A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 王敏;方仁渊 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/11;G06T7/194 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 唐红 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 自动 分类 方法 | ||
1.一种基于深度学习的人车自动分类方法,其特征在于:依次包括以下步骤:
步骤A,采集道路视频数据;
步骤B,对步骤A得到的视频数据中的每相邻三帧源图像,依次采用三帧差分法和背景消减法进行运动目标检测,得到运动目标图像区域;
步骤C,对步骤B获得的各个运动目标图像区域进行灰度化,用二值阈值分割方法将运动目标图像区域分割成目标和背景,并对步骤B获得的运动目标图像区域中与目标对应的局部图像做归一化,得到归一化局部图像;
步骤D,将步骤C获得的归一化局部图像及其标签输入到深度学习神经网络中,结合回归模型对所述深度学习神经网络进行训练,获得深度学习网络模型,所述标签包括车辆和行人;
步骤E,将步骤C所得的待识别局部图像输入到步骤D中训练好的深度学习网络模型中,完成对人车的识别和分类。
2.根据权利要求1所述的基于深度学习的人车自动分类方法,其特征在于:所述步骤B中运动目标检测的过程如下:
步骤B-1,对所述步骤A中得到的视频数据中的每相邻三帧源图像使用三帧差分法,得到中间图像S;
步骤B-2,对所述相邻三帧源图像中的最后一帧使用背景消减法,得到中间图像T;
步骤B-3,分别对中间图像S和T二值化,得到二值化图像Ss和Tt;
步骤B-4,将二值化图像Ss和Tt进行逻辑或运算得到中间图像P;
步骤B-5,对中间图像P进行后处理,去除噪声,并平滑分割出运动目标的边界。
3.根据权利要求2所述的基于深度学习的人车自动分类方法,其特征在于:所述步骤B-5中,所述后处理的过程包括连通区域分析和形态学滤波。
4.根据权利要求1所述的基于深度学习的人车自动分类方法,其特征在于:所述步骤D中,所述深度学习神经网络模型包括依次连接的图像输入层、编码层、全连接层和softmax层,其中:
编码层包括五个子编码层,且每相邻两个子编码层之间均设有池化层;
所述五个子编码层中靠近所述图像输入层的第一子编码层和第二子编码层中均设有两个子卷积层、两个子批量归一化层和两个子ReLU层;
所述五个子编码层中其余三个编码层,即第三子编码层、第四子编码层和第五子编码层中均设有三个子卷积层、三个子批量归一化层和三个子ReLU层。
5.根据权利要求1所述的基于深度学习的人车自动分类方法,其特征在于:所述步骤E的详细过程为:
(1)利用深度学习神经网络中的编码层对所述归一化局部图像进行卷积和池化处理,获得特征图像;具体地,
(a)通过子卷积层对图像提取局部特征,通过N个卷积核对图像同时卷积,得到N组特征图像,将这N组特征图像输入下一层子批量归一化层;其中,在不同的编码层中,N取不同的值,且随着层数的增加,N值也会增加;
(b)通过子批量归一化层,对所述初始特征图像进行归一化处理,使特征的均值为0、方差为1;
(c)通过子ReLU层激活归一化后的初始特征图像中的部分特征;
(d)根据网络中不同的编码层,重复步骤(a)到(c)多次,且一般重复次数不超过6次,提取出图像特征;
(e)通过池化层对激活后的初始特征图像进行下采样处理;其中,滑动窗口大小设为3X3,窗口每次移动步长设为2个像素,通过下采样之后,获得的特征图像大小变成输入的初始特征图像大小的1/3;
(e)重复步骤(a)到(e),使得特征越来越抽象;
(2)在经过多轮卷积层和池化层的处理之后,进入全连接层,通过全连接层来完成分类任务;
(3)通过Softmax层得到当前样本属于不同类的后验概率,完成最终的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711119313.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车道线检测方法及系统
- 下一篇:人物情绪分析方法、装置及存储介质