[发明专利]基于重要性加权的道路场景图像语义分割方法有效
申请号: | 201811544813.1 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109740451B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 袁夏;周宏扬;马浩炎 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/82;G06N3/04;G06N3/08;G06T5/00;G06T7/10 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 封睿 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 重要性 加权 道路 场景 图像 语义 分割 方法 | ||
1.基于重要性加权的道路场景图像语义分割方法,其特点在于,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割;
重要性加权的损失函数,将道路场景中车辆和行人作为重要类别,确定重要类别和非重要类别的交叉熵损失值,再按照两种重要性类别的系数进行加权,得到重要性加权的损失函数值;使用向量IG1,IG2来表示两种重要性类别的交叉熵损失值,则第j个元素(IGi)j,i=1,2的损失函数值具体为:
其中,Wi表示第i组类别像素的重要性权重值,P表示像素点在整个图片所有像素点中所占的频率,q表示独热编码one-hot,c表示第c种场景类别的像素点。
2.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,SegNet神经网络架构包括5个卷积模块和反卷积模块,每个卷积块中包含3个卷积层和一个最大池化的池化层,每个反卷积模块包含3个反卷积层和一个上采样层。
3.根据权利要求2所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,卷积模块和反卷积模块的卷积核选取大小为3*3的卷积核。
4.根据权利要求2所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,卷积模块和反卷积模块采用ReLu激活函数。
5.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,训练神经网络模型时,把整个数据集均分成K个子集,每次选取一个子集作为测试集,从K-1个子集中选出3/4作为训练数据集,剩下的1/4作为验证数据集,进行K次交叉验证,得到训练好的神经网络模型。
6.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,在训练前,对CityScapes数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强,扩充数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811544813.1/1.html,转载请声明来源钻瓜专利网。