[发明专利]基于立体视觉的行人检测与测距方法有效
申请号: | 201710149283.X | 申请日: | 2017-03-14 |
公开(公告)号: | CN106952274B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 宋彬;杨荣坚;秦浩 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/00;G01C3/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 立体 视觉 行人 检测 测距 方法 | ||
1.一种基于立体视觉的行人检测与测距方法,包括如下步骤:
(1)获取立体视觉图像:
使用双目摄像头拍摄待检测与测距的包含行人通过的监控场景,得到该场景的立体视觉左图像和立体视觉右图像;
(2)构建卷积神经网络:
构建一个包含8个卷积层、5个抽取层和1个全连接层的卷积神经网络;
(3)计算立体视觉左图像的预测值:
(3a)将立体视觉左图像输入到卷积神经网络中,输出尺寸为980×1个像素的特征向量;
(3b)将立体视觉左图像均匀划分为14×14个正方形区域;
(3c)将卷积神经网络输出的980×1个像素的特征向量中的所有的向量元素,均匀分配给立体视觉左图像的每个正方形区域,每个正方形区域得到5个向量元素;将每个正方形区域的5个向量元素,依次作为该区域的行人存在概率预测值、行人横坐标预测值、行人纵坐标预测值、行人宽度预测值、行人高度预测值;
(4)判断立体视觉左图像的每个正方形区域的行人存在概率预测值是否大于0.5,若是,则认为该区域存在行人,执行步骤(5);否则,认为该区域不存在行人,执行步骤(6);
(5)对预测值做去归一化处理:
将存在行人的正方形区域的行人横坐标预测值、行人纵坐标预测值、行人宽度预测值、行人高度预测值分别做去归一化处理,得到用于确定行人位置的横坐标值和纵坐标值、行人的宽度值和行人的高度值;
(6)计算匹配代价值:
(6a)将立体视觉左图像中每个像素点的视差值的取值范围设置为0到255个灰度值;
(6b)按照下式,计算立体视觉左图像中每个像素点分别取0到255灰度值范围内的每个视差值的匹配代价值:
其中,Cp表示立体视觉左图像中每个像素点分别取0到255灰度值范围内的各个视差值的匹配代价值,dp表示立体视觉左图像中第p个像素点的视差值,∑表示求和操作,u表示立体视觉左图像中第p个像素点的5×5个像素邻域中的像素点,∈表示属于符号,N表示立体视觉左图像中第p个像素点的5×5个像素的邻域,|·|表示取绝对值操作,IL表示立体视觉左图像,xu表示立体视觉左图像中第p个像素点的5×5个像素邻域中的像素点u的横坐标值,yu表示立体视觉左图像中第p个像素点的5×5个像素邻域中的像素点u的纵坐标值,IR表示立体视觉右图像;
(7)选择最优视差值:
对立体视觉左图像中每个像素点,从0到255灰度值范围内的各个视差值中,选择使该像素点的匹配代价值最小时的视差值作为最优视差值;
(8)按照下式,计算立体视觉左图像中存在行人的区域中行人离摄像头的距离:
其中,Zi表示存在行人的第i个区域中行人离摄像头的距离,f表示双目摄像头的焦距,×表示相乘操作,T表示双目摄像头的中心距,Di表示存在行人的第i个区域中行人位置像素点的最优视差值;
(9)输出立体视觉左图像中存在行人的区域中的行人离摄像头的距离。
2.根据权利要求1所述的基于立体视觉的行人检测与测距方法,其特征在于:步骤(2)中所述构建的包含8个卷积层、5个抽取层和1个全连接层的卷积神经网络的14层网络层连接关系是,按照第1个卷积层、第1个抽取层、第2个卷积层、第2个抽取层、第3个卷积层、第3个抽取层、第4个卷积层、第4个抽取层、第5个卷积层、第5个抽取层、第6个卷积层、第7个卷积层、第8个卷积层、全连接层的次序依次相连。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710149283.X/1.html,转载请声明来源钻瓜专利网。