[发明专利]一种行人姿势多特征智能辨识方法有效
申请号: | 201810578415.5 | 申请日: | 2018-06-05 |
公开(公告)号: | CN108805907B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 刘辉;李燕飞 | 申请(专利权)人: | 中南大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/00;G06N3/08 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 姿势 特征 智能 辨识 方法 | ||
1.一种行人姿势多特征智能辨识方法,其特征在于,包括以下步骤:
步骤1:构建行人样本图像数据库;
所述行人样本图像数据库是从路口监控视频中提取连续的行人图像帧,获取三类图像组;
所述三类图像组,分别为不含行人的负样本、包含多个行人的多人样本以及只包含同一行人的单行人样本,每类图像组至少包括300帧图像;
步骤2:对行人样本数据库中的行人图像帧进行预处理,并对预处理后的图像设置行人检测框、行人目标标识以及行人位置标签向量;
所述行人检测框是行人图像帧中行人轮廓的最小外接矩形;
所述行人目标标识是所有行人图像帧中出现的不同行人的唯一标识P;
所述行人位置标签向量的表达形式为[t,x,y,a,b],t表示当前行人图像帧属于监控视频中的第t帧,x和y分别表示行人图像帧中的行人检测框的左下角的横坐标和纵坐标,a和b分别表示行人检测框长和宽;
步骤3:构建基于极限学习机的行人检测模型;
以行人样本数据库中行人图像帧经过预处理后的图像作为输入数据,对应的行人位置标签向量和行人数量作为输出数据,对极限学习机进行训练,得到基于极限学习机的行人检测模型;
所述极限学习机的输入层节点个数为输入图像的像素点个数s,隐含层小波元个数为2s-1,输出层节点个数为5Pe,Pe为输入图像中的最大行人数量,训练过程中的最大迭代次数设置为2000,训练学习率为0.01,阈值为0.00005;
步骤4:构建基于BP神经网络的行人跟踪模型;
依次将经过预处理的相邻两帧图像中的行人跟踪检测图和利用基于极限学习机的行人检测模型提取的对应行人位置标签向量作为输入层数据,以前一帧行人图像中的行人在后一帧行人图像中的跟踪结果为输出层数据,对BP神经网络模型进行训练,获得基于BP神经网络的行人跟踪模型;
所述前一帧行人图像中的行人在后一帧行人图像中的出现结果是指如果前一帧行人图像中的行人,在后一帧行人图像中出现,则该行人的跟踪结果为1,否则为0;若行人跟踪结果为1,则将后一帧行人图像中出现的对应行人位置标签向量添加至行人轨迹中,所述行人轨迹的初始值为在监控视频中第一次出现在图像中的行人位置标签向量;
步骤5:行人轨迹实时跟踪辨识;
从实时监控视频中,依次提取两帧相邻的行人图像,输入所述基于极限学习机的行人检测模型中,进行两帧图像中行人位置标签向量和行人数量的检测,然后将两帧图像中的行人跟踪检测图输入所述基于BP神经网络的行人跟踪模型,对前一帧行人图像中出现的行人进行行人轨迹跟踪,得到监控视频中,所有行人的跟踪轨迹。
2.根据权利要求1所述的方法,其特征在于,对行人样本图像和实时采集的监控图像进行以下预处理:
步骤A1:对从路口监控视频中提取的图像帧进行统一尺寸裁剪;
步骤A2:对裁剪后的图像进行灰度化处理,再采用Gamma校正法调节图像对比度;
步骤A3:提取经过对比度调节后的图像的方向梯度直方图特征,并采用PCA对方向梯度直方图特征进行降维处理;
步骤A4:利用降维后的方向梯度直方图特征与设定的方向梯度直方图阈值,提取超过设定的方向梯度直方图阈值的降维后的方向梯度直方图特征,获得对应的行人区域;
步骤A5:对行人区域进行平滑去噪处理,并提取最大连通域作为行人轮廓区域;
步骤A6:以行人轮廓区域的最大宽度和最大高度,作为行人检测框的宽度和高度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810578415.5/1.html,转载请声明来源钻瓜专利网。