[发明专利]一种面向自动驾驶场景的基于深度学习的语义分割方法在审
申请号: | 202011585194.8 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112508977A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 赵继民;许俊辉;王颖;林丽媛;腾万伟;向炼;郝迪;韦赛远 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06T7/12 | 分类号: | G06T7/12;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300222 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 自动 驾驶 场景 基于 深度 学习 语义 分割 方法 | ||
1.一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,包括:
步骤A1,Camvid和Cityscapes数据集划分部分;
步骤A2,采用图像翻转、旋转、缩放和移位等几何变换增强模型训练数据;
步骤A3,Xception作为主干网络对复杂场景图像中目标对象的特征提取;
步骤A4,对网络模型的损失函数进行优化处理;
步骤A5,验证深度网络模型效果并实现街景图像的语义分割图。
2.如权利要求1一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,其中所述Camvid和Cityscapes数据集划分部分:Cityscapes主要是由5000张精细标注的图像作为对街景图像分割模型训练和测试的样本数据,CamVid数据集是第一个具有目标类别语义标签的视频集合,Camvid和Cityscapes数据集中训练集和测试集的比例为7∶3。
3.如权利要求1一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,其中所述对图像翻转、旋转、缩放和移位等几何变换增强模型训练数据部分:为了避免因为样本较小造成的网络过拟合现象的产生采用数据增强的方法来增大学习的样本数量,主要是对图像进行翻转、旋转、缩放、裁剪和移位等处理,改变原始数据集中的几何空间来扩展模型训练数据。实验环境主要在以Python编程语言为基础的Tensorflow环境下进行,并使用CUDA进行加速运算。
4.如权利要求1一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,其中所述Xception作为主干网络对复杂场景图像中目标对象的特征提取部分:使用进行改进后的Xception模型作为主干网络,改进后的网络将扩展卷积和深度可分离卷积组成了扩张分离卷积,将原来模型中的最大池化操作换成了带有下采样的深度可分离卷积,并在每个3×3的卷积后面添加了批量归一化处理和Relu激活函数,完成对复杂场景图像中目标对象的特征提取。
5.如权利要求1一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,其中所述对网络模型的损失函数进行优化处理部分:在训练神经网络模型时为了避免模型的过拟合问题,使网络模型具有良好的泛化能力,采用了随机梯度下降算法(SGD)和L1正则化对网络模型的损失函数进行训练和优化处理,使模型达到更好的性能。以Xception-65作为主干模型的DeeplabV3+网络,在CamVid和Cityscapes数据集上进行迭代测试,分别验证训练数据和迭代次数对网络模型优化性能的影响。
6.如权利要求1一种自动驾驶场景中基于编码器-解码器模型进行深度学习的语义分割方法研究,其中所述验证深度网络模型效果并实现街景图像的语义分割图部分:通过消融实验,分析总结不同深度的网络结构中Output stride和空洞卷积率的分割效果。最终采用Output stride=16和空洞卷积率为[6,12,18]的网络对街景图像的进行分割,获得最优街景图像的语义分割图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011585194.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种启动平稳的电动剪叉式升降平台
- 下一篇:一种太阳能板