[发明专利]一种基于双目立体视觉的道路可行驶区域识别方法在审
申请号: | 201910187216.6 | 申请日: | 2019-03-13 |
公开(公告)号: | CN110008848A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 李巍华;王航;方卓琳 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;黄海波 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双目立体视觉 行驶区域 深度图 图像 预处理 测试和验证 单目摄像头 测试数据 车辆智能 分割模型 感知数据 可靠数据 模型实现 摄像头组 所述空间 图像输入 语义分割 自动驾驶 左摄像头 数据集 训练集 标定 浅层 合成 采集 驾驶 输出 智能 改进 网络 | ||
1.一种基于双目立体视觉的道路可行驶区域识别方法,其特征在于,包括步骤:
(1)将对自动驾驶领域公认的可靠数据集进行采集和预处理后的图像输入至左、右单目摄像头并通过双目立体视觉求得空间深度图,将所述空间深度图与原始左摄像头RGB图像合成双目立体视觉的RGB-D图像,构成训练、测试和验证数据集;
(2)将所述训练集输入到基于改进的Alexnet浅层网络进行语义分割和不断的迭代训练、优化参数,使其达到预定的模型收敛状态,最终固化模型参数,完成训练作为最终的语义分割模型,再将测试数据输入分割模型,从而输出包含可行驶区域的图像;
(3)启动智能车上已经完成安装、标定完整的双目立体视觉摄像头组,对交通环境信息进行测试图像采集,取得双目立体视觉图像,将其输入到训练好的模型实现道路可行驶区域的识别。
2.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述的步骤(1)具体包括:
通过左、右单目图像进行立体视觉匹配求得视差图,之后根据系统双目视觉模型求得空间深度图,最后将空间深度图作为第四通道叠加在RGB图像上,形成RGB-D图像。
3.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述步骤(2)中,通过构造卷积神经网络作为特征提取的编码器,其中,对Alexnet浅层网络的改进主要包括:
(1)去除全连接层,只保留网络的卷积层和池化层;
(2)将原始Alexnet所有的池化层改为2x2,去除掉所有的3x3池化层;
(3)将第一层卷积层的大小由11x11改为3x3,将其步长改为1,并且使padding=1;
(4)在第二层卷积层和第二层池化层之间加入同第二层卷积层相同的卷积层,增加网络的深度,使得新网络的卷积层数为6,而池化层数则保持不变。
4.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,步骤(2)中,所述改进的Alexnet浅层网络的训练过程包括:
(1)将所述空间深度图与原始左摄像头RGB图像合成为RGB-D图像,将其整理为训练数据集;
(2)运用带有标签的训练数据集,将训练数据输入到设计好的语义分割网络,图片经过若干卷积层和池化层,进行特征提取;
(3)采用反卷积对池化层进行上采样,通过反卷积将搜索上采样还原出整张图像,映射到图片像素级别,对智能车辆的可行驶区域像素进行概率预测;
(4)实现语义分割标示并输出可行驶区域的图像。
5.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述对自动驾驶领域公认的可靠数据集进行采集和预处理具体包括:
运用KITTI和CITYSCAPES数据集得到训练图像和评价图像;
对所述训练图像和评价图像进行数据增强处理,通过对称、翻转、平移和旋转操作,得到数量更大、覆盖面更全的训练数据集。
6.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,
所述改进的Alexnet浅层网络的语义分割模型包括:12个卷积层,3个池化层,3个反卷积层(进行上采样),以及一层Softmax层用来预测像素概率。
7.根据权利要求4中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述对智能车辆的可行驶区域像素进行概率预测具体是利用随机梯度下降的方法训练输出层的Softmax回归层,直至回归的损失函数实现预定的收敛,达到预定的预测分割识别效果。
8.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述的可行驶区域具体是指除去所有障碍物、允许车辆行驶的所有道路区域。
9.根据权利要求8中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述允许车辆行驶的所有道路区域从物理结构层面包括结构化路面、半结构化路面以及非结构化路面。
10.根据权利要求9中所述基于双目立体视觉的道路可行驶区域识别方法,其特征在于,所述的结构化的路面其道路边缘规则,路面的结构单一、整齐,有明显的车道线及其它人工标记的行车道路,其结构层按照一定的标准执行,面层的颜色和材质保持统一;所述半结构化的路面是指一般的非标准化的路面,路面面层的颜色和材质存在差异;所述非结构化的路面指没有结构层的自然道路场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910187216.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序