[发明专利]基于多尺度特征和编解码器模型的街景图像语义分割方法有效
申请号: | 201910475662.7 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110175613B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 龚声蓉;尚叶欣;钟珊;应文豪;潘威 | 申请(专利权)人: | 常熟理工学院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张俊范 |
地址: | 215500 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多尺度特征和编解码器模型的街景图像语义分割方法,包括以下步骤:原始图像输入深度卷积神经网络提取初始特征图;将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图;第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图;第二特征图通过然后利用上采样操作和跳跃连接还原为原始图像大小得到最终的预测图;所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块输出特征图由通过1×1卷积、通过四个扩张率不同的atrous卷积以及通过平均池化操作提取的六种尺度的特征图级联后输出。本发明方法能够提高语义分割结果的精度,对目标边界的像素进行更准确的分类。 | ||
搜索关键词: | 基于 尺度 特征 编解码器 模型 街景 图像 语义 分割 方法 | ||
【主权项】:
1.一种基于多尺度特征和编解码器模型的街景图像语义分割方法,其特征在于,包括以下步骤:S1、原始图像输入深度卷积神经网络提取初始特征图;S2、将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图;S3、将第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图;S4、由所述第二特征图通过1×1卷积和第一上采样层与第一特征图1×1卷积后的特征图相连接还原成第一还原图;S5、所述第一还原图通过第二上采样层与所述初始特征图1×1卷积后相连接得到第二还原图;S6、所述第二还原图通过3×3卷积和第三上采样层还原为原始图像大小得到最终的预测图;所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块对输入的特征图处理输出特征图的方法为:将输入的特征图分别通过1×1卷积提取第一种尺度的特征图,通过四个扩张率不同的atrous卷积提取四种不同尺度下的特征图,通过平均池化操作提取最后一种尺度的特征图,共获得六种尺度的特征图;将所述六种尺度的特征图级联后得到最终的包含多尺度信息的特征图输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟理工学院,未经常熟理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910475662.7/,转载请声明来源钻瓜专利网。