[发明专利]一种基于双目立体视觉的道路可行驶区域识别方法在审

申请号：	201910187216.6	申请日：	2019-03-13
公开（公告）号：	CN110008848A	公开（公告）日：	2019-07-12
发明（设计）人：	李巍华;王航;方卓琳	申请（专利权）人：	华南理工大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;黄海波
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	双目立体视觉行驶区域深度图图像预处理测试和验证单目摄像头测试数据车辆智能分割模型感知数据可靠数据模型实现摄像头组所述空间图像输入语义分割自动驾驶左摄像头数据集训练集标定浅层合成采集驾驶输出智能改进网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于双目立体视觉的道路可行驶区域识别方法，其特征在于，包括步骤：

（1）将对自动驾驶领域公认的可靠数据集进行采集和预处理后的图像输入至左、右单目摄像头并通过双目立体视觉求得空间深度图，将所述空间深度图与原始左摄像头RGB图像合成双目立体视觉的RGB-D图像，构成训练、测试和验证数据集；

（2）将所述训练集输入到基于改进的Alexnet浅层网络进行语义分割和不断的迭代训练、优化参数，使其达到预定的模型收敛状态，最终固化模型参数，完成训练作为最终的语义分割模型，再将测试数据输入分割模型，从而输出包含可行驶区域的图像；

（3）启动智能车上已经完成安装、标定完整的双目立体视觉摄像头组，对交通环境信息进行测试图像采集，取得双目立体视觉图像，将其输入到训练好的模型实现道路可行驶区域的识别。

2.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述的步骤（1）具体包括：

通过左、右单目图像进行立体视觉匹配求得视差图，之后根据系统双目视觉模型求得空间深度图，最后将空间深度图作为第四通道叠加在RGB图像上，形成RGB-D图像。

3.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述步骤(2)中，通过构造卷积神经网络作为特征提取的编码器，其中，对Alexnet浅层网络的改进主要包括：

（1）去除全连接层，只保留网络的卷积层和池化层；

（2）将原始Alexnet所有的池化层改为2x2，去除掉所有的3x3池化层；

（3）将第一层卷积层的大小由11x11改为3x3，将其步长改为1，并且使padding=1；

（4）在第二层卷积层和第二层池化层之间加入同第二层卷积层相同的卷积层，增加网络的深度，使得新网络的卷积层数为6，而池化层数则保持不变。

4.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，步骤(2)中，所述改进的Alexnet浅层网络的训练过程包括：

（1）将所述空间深度图与原始左摄像头RGB图像合成为RGB-D图像，将其整理为训练数据集；

（2）运用带有标签的训练数据集，将训练数据输入到设计好的语义分割网络，图片经过若干卷积层和池化层，进行特征提取；

（3）采用反卷积对池化层进行上采样，通过反卷积将搜索上采样还原出整张图像，映射到图片像素级别，对智能车辆的可行驶区域像素进行概率预测；

（4）实现语义分割标示并输出可行驶区域的图像。

5.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述对自动驾驶领域公认的可靠数据集进行采集和预处理具体包括：

运用KITTI和CITYSCAPES数据集得到训练图像和评价图像；

对所述训练图像和评价图像进行数据增强处理，通过对称、翻转、平移和旋转操作，得到数量更大、覆盖面更全的训练数据集。

6.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，

所述改进的Alexnet浅层网络的语义分割模型包括：12个卷积层，3个池化层，3个反卷积层（进行上采样），以及一层Softmax层用来预测像素概率。

7.根据权利要求4中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述对智能车辆的可行驶区域像素进行概率预测具体是利用随机梯度下降的方法训练输出层的Softmax回归层，直至回归的损失函数实现预定的收敛，达到预定的预测分割识别效果。

8.根据权利要求1中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述的可行驶区域具体是指除去所有障碍物、允许车辆行驶的所有道路区域。

9.根据权利要求8中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述允许车辆行驶的所有道路区域从物理结构层面包括结构化路面、半结构化路面以及非结构化路面。

10.根据权利要求9中所述基于双目立体视觉的道路可行驶区域识别方法，其特征在于，所述的结构化的路面其道路边缘规则，路面的结构单一、整齐，有明显的车道线及其它人工标记的行车道路，其结构层按照一定的标准执行，面层的颜色和材质保持统一；所述半结构化的路面是指一般的非标准化的路面，路面面层的颜色和材质存在差异；所述非结构化的路面指没有结构层的自然道路场景。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910187216.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于卷积神经网络的泳姿识别方法
下一篇：信号灯的识别方法、装置、存储介质和处理器

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于双目立体视觉的道路可行驶区域识别方法在审

专利文献下载