[发明专利]基于重要性加权的道路场景图像语义分割方法有效
申请号: | 201811544813.1 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109740451B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 袁夏;周宏扬;马浩炎 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/82;G06N3/04;G06N3/08;G06T5/00;G06T7/10 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 封睿 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 重要性 加权 道路 场景 图像 语义 分割 方法 | ||
本发明公开了基于重要性加权的道路场景图像语义分割方法,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割。本发明使用损失函数加权的方法分割道路场景图像,车辆和行人的分割更精细。
技术领域
本发明属于道路分割技术,具体是涉及一种基于重要性加权的道路场景图像语义分割方法。
背景技术
语义分割是计算机视觉中十分重要的领域,它是指像素级地识别图像,即标注出图像中每个像素所属的对象类别。近年的自动驾驶技术中,也需要用到这种技术。车载摄像头探查到图像,后台计算机可以自动将图像分割归类,以避让行人和车辆等障碍。目前图像语义分割大部分都在采用深度学习技术,但是基于深度学习的几种网络模型都各有侧重点,专门用于道路场景的图像分割的方法比较少。
发明内容
本发明的目的在于提供一种基于重要性加权的道路场景图像语义分割方法,提升了车辆和行人的分割精度。
实现本发明目的的技术解决方案为:一种基于重要性加权的道路场景图像语义分割方法,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割。
作为一种优选实施方式,SegNet神经网络架构包括5个卷积模块和反卷积模块,每个卷积模块中包含3个卷积层和一个最大池化的池化层,每个反卷积模块包含3个反卷积层和一个上采样层。
作为一种更优选实施方式,卷积模块和反卷积模块的卷积核选取大小为3*3的卷积核。
作为一种更优选实施方式,卷积模块和反卷积模块采用ReLu激活函数。
作为一种优选实施方式,重要性加权的损失函数,将道路场景中车辆和行人作为重要类别,确定重要类别和非重要类别的交叉熵损失值,再按照两种重要性类别的系数进行加权,得到重要性加权的损失函数值;使用向量IG1,IG2来表示两种重要性类别的交叉熵损失值,则第j个元素(IGi)j(i=1,2)的损失函数值具体为:
其中,Wi表示第i组像素点的重要性权重,P表示像素点在整个图片所有像素点中所占的频率,q表示独热编码(one-hot),c表示第c种场景类别的像素点。
作为一种优选实施方式,训练神经网络模型时,把整个数据集均分成K个子集,每次选取一个子集作为测试集,从K-1个子集中选出3/4作为训练数据集,剩下的1/4作为验证数据集,进行K次交叉验证,得到训练好的神经网络模型。
作为一种优选实施方式,在训练前,对CityScapes数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强,扩充数据集。
本发明与现有技术相比,其显著优点为:1)本发明使用损失函数加权的方法分割道路场景图像,车辆和行人的分割更精细;2)本发明在网络结构的反卷积和上采样部分,使用在卷积阶段记录的最大池化的指数信息,使得最后分割结果更好。
附图说明
图1为本发明的基于重要性加权的道路场景图像语义分割方法的流程图。
图2为最大池化的池化层的示意图。
图3为第一层卷积的变换示意图。
图4为第二层卷积的变换示意图。
具体实施方式
下面结合附图和具体实施例,进一步说明本发明方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811544813.1/2.html,转载请声明来源钻瓜专利网。