[发明专利]基于多尺度特征和编解码器模型的街景图像语义分割方法有效

申请号：	201910475662.7	申请日：	2019-06-03
公开（公告）号：	CN110175613B	公开（公告）日：	2021-08-10
发明（设计）人：	龚声蓉;尚叶欣;钟珊;应文豪;潘威	申请（专利权）人：	常熟理工学院
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/46;G06N3/04;G06N3/08
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	张俊范
地址：	215500 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于多尺度特征和编解码器模型的街景图像语义分割方法，包括以下步骤：原始图像输入深度卷积神经网络提取初始特征图；将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图；第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图；第二特征图通过然后利用上采样操作和跳跃连接还原为原始图像大小得到最终的预测图；所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块输出特征图由通过1×1卷积、通过四个扩张率不同的atrous卷积以及通过平均池化操作提取的六种尺度的特征图级联后输出。本发明方法能够提高语义分割结果的精度，对目标边界的像素进行更准确的分类。
搜索关键词：	基于尺度特征编解码器模型街景图像语义分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于多尺度特征和编解码器模型的街景图像语义分割方法，其特征在于，包括以下步骤：S1、原始图像输入深度卷积神经网络提取初始特征图；S2、将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图；S3、将第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图；S4、由所述第二特征图通过1×1卷积和第一上采样层与第一特征图1×1卷积后的特征图相连接还原成第一还原图；S5、所述第一还原图通过第二上采样层与所述初始特征图1×1卷积后相连接得到第二还原图；S6、所述第二还原图通过3×3卷积和第三上采样层还原为原始图像大小得到最终的预测图；所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块对输入的特征图处理输出特征图的方法为：将输入的特征图分别通过1×1卷积提取第一种尺度的特征图，通过四个扩张率不同的atrous卷积提取四种不同尺度下的特征图，通过平均池化操作提取最后一种尺度的特征图，共获得六种尺度的特征图；将所述六种尺度的特征图级联后得到最终的包含多尺度信息的特征图输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于常熟理工学院，未经常熟理工学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910475662.7/，转载请声明来源钻瓜专利网。

上一篇：基于OCR技术的在线考试方法及系统
下一篇：一种印刷电路板过孔内壁质量的检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多尺度特征和编解码器模型的街景图像语义分割方法有效

专利文献下载