[发明专利]一种基于DSSNN神经网络的铁路场景图像语义分割方法在审
申请号: | 201810537136.4 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108875596A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 唐鹏;何正伟;金炜东 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/00;G06T7/10;G06N3/04 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 王沙沙 |
地址: | 610031 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义分割 铁路 神经网络 场景图像 场景 关键部件 训练模型 场景图像数据 神经网络模型 标签图像 解码结构 铁路巡检 图像语义 原始图像 状态检测 端对端 鲁棒性 有效地 构建 工作量 标签 制作 学习 | ||
1.一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,包括以下步骤:
步骤1:构建DSSNN神经网络;
步骤2:获取铁路场景图像数据集,制作图像语义标签,采用标签图像和原始图像通过深度学习框架和平台对DSSNN神经网络进行训练,得到训练模型;
步骤3:将铁路场景图像输入训练模型,得到铁路场景图像语义分割图;
其中DSSNN神经网络包括卷积块、空洞卷积块、求和块、反卷积块和对称连接块;卷积块用于提取图像特征;空洞卷积块用于扩大卷积感受并减少特征损失;求和块用于将空洞卷积块中的特征进行融合提高分割精度;反卷积块用于提取图像特征同时还原图像尺寸;对称连接块用于将卷积块中的特征图和反卷积块的特征图进行融合,补充卷积块中丢失的图像特征和图像中细小且被忽略的特征;
铁路场景图像经过卷积块后输入空洞卷积块,空洞卷积块处理后输入求和块将每个空洞卷积块的每个块中的结果求和相加;输入反卷积块对图像处理然后输入对称连接块使分割图像得到修复;最后对特征进行分类,完成图像语义分割。
2.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述卷积块输出结果如下:
N=(W-F+2×P)/S=1
式中:N为卷积后输出图像尺寸,W为输入图片大小,F为卷积核大小,P为填充的像素数,S为卷积步长。
3.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述空洞卷积块中空洞卷积核的计算公式如下:
Kernel_extend=Original_kernel_shape+I×(kernel_shape-1)
式中:Kernel_extend为空洞卷积的卷积核大小,Original_kernel_shape为上一个卷积核大小,kernel_shape为当前采用的卷积核大小,I为卷积核扩张的程度。
4.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述反卷积块输出结果如下:
N=(W-1)×S+F-2×P
式中:N为卷积后输出图像尺寸,W为输入图片大小,F为卷积核大小,P为填充的像素数,S为卷积步长。
5.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述对特征进行分类,采用Softmax函数对图像中的像素点进行分类;如下所示:
式中:Si为单个像素值与所有像素值和的比值,i为图像中单个像素点,ei为该像素点的指数值,ej为所有像素点的指数值,j为所有像素点。
6.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述步骤2中标签图像和原始图像输入DSSNN神经网络之前对图像进行数据增强操作;过程如下:
将若干张原始图像和对应的若干张标签图像进行随机同分布、同尺寸、同角度的变换,将数据量增强到万级单位。
7.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,步骤3中需对DSSNN神经网络进行测试,具体过程如下:
S1:将铁路场景图像的尺寸缩放到DSSNN神经网络要求的大小,将图像中的像素点转换成一个多维度矩阵,将得到的矩阵值送入到DSSNN神经网络中;
S2:通过DSSNN神经网络预测得到具体类别数字的矩阵;
S3:将矩阵中的类别数字,按照与之对应的RGB值表进行填充,得到语义分割结果。
8.根据权利要求1所述的一种基于DSSNN神经网络的铁路场景图像语义分割方法,其特征在于,所述步骤2具体过程如下:
S11:将原始的RGB三通道图像转换成[0-255]之间的灰度图像,过程如下:
Gray=R×0.299+G×0.587+B×0.114
式中:Gray为输出的灰度图像,R为红色像素,G为绿色像素,B为蓝色像素。
S12:进行数据增强操作;
S13:分别通过以TensorFlow为后端的Keras深度学习框架和平台进行DSSNN神经网络模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810537136.4/1.html,转载请声明来源钻瓜专利网。