[发明专利]基于注意力机制指导特征融合的图像语义分割方法在审
申请号: | 201910391452.X | 申请日: | 2019-05-13 |
公开(公告)号: | CN110210485A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 龚声蓉;周鹏程 | 申请(专利权)人: | 常熟理工学院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 吴茂杰 |
地址: | 215500 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力机制 特征融合 图像语义 构建 分割 特征融合模块 解码器 金字塔结构 一致性约束 语义 边界轮廓 低分辨率 分层训练 高层语义 高分辨率 基础网络 加权融合 阶段特征 解码阶段 损失函数 语义变化 语义分割 编码器 上采样 低层 卷积 三层 叠加 追加 监督 输出 融合 改进 | ||
1.一种基于注意力机制指导特征融合的图像语义分割方法,其特征在于,包括如下步骤:
(10)编码器基础网络构建:使用改进后的ResNet-101生成一系列由高分辨率低语义到低分辨率高语义变化的特征;
(20)解码器特征融合模块构建:采用基于三层卷积操作的金字塔结构模块,提取强一致性约束的高层语义,再向低层阶段特征逐层加权融合,得到初步分割热图;
(30)辅助损失函数构建:向解码阶段的每个融合输出追加辅助监督,再与热图上采样后的主监督损失叠加,强化模型的分层训练,得到语义分割图。
2.根据权利要求1所述的图像语义分割方法,其特征在于,
所述(10)编码器基础网络构建步骤包括:
(11)构建块层数重部署:重新部署res-2到res-5阶段各自拥有的构建块数量,将原始ResNet-101的res-2到res-5的{3,4,23,3}构建块数量调整为{8,8,9,8};
(12)扩大感受野:将ResNet-101基础网络结构中res-5阶段的传统卷积改为扩张率为2的空洞卷积。
3.根据权利要求1所述的图像语义分割方法,其特征在于,
所述(20)解码器特征融合模块构建步骤包括:
(21)提取末端高层语义信息:采用基于三层卷积操作的类似金字塔的结构模块,在模块中分别使用3×3,5×5和7×7的卷积,通过融合不同尺度的上下文,得到具有最强类内语义一致性的高层语义;
(22)融合上下文特征:通过逐层合并相邻阶段的特征从而计算出通道注意向量,以此作为加权选择出低层阶段中判别力强的特征信息,并与相邻高阶段特征相融合,得到初步分割热图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟理工学院,未经常熟理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910391452.X/1.html,转载请声明来源钻瓜专利网。