[发明专利]基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法有效
申请号: | 202010865812.8 | 申请日: | 2020-08-25 |
公开(公告)号: | CN112001960B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张丹;刘京;余义德;张志伟;时光;孙杰;夏光辉;王红萍 | 申请(专利权)人: | 中国人民解放军91550部队 |
主分类号: | G06T7/55 | 分类号: | G06T7/55;G06V10/80;G06N3/04;G06N3/08;G06T7/40 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 116023 *** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 金字塔 注意力 网络 模型 图像 深度 估计 方法 | ||
1.一种基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法,其特征在于,该方法涉及的网络模型包括由SENet模块和MFF+MACA模块构成的用于自适应聚合全局上下文信息的编码器部分Encoder以及估计复杂场景结构的残差金字塔解码器部分RRM-Decoder两部分,编码器部分得到残差深度图和预测深度图,经过解码器部分处理得到最终的精细深度图,该方法操作步骤包括:
第1步、获得待估计图像;
第2步、由编码器部分中的SENet模块提取图像中包含位置信息的低级特征;
第3步、编码器部分中的MFF+MACA模块由一个多尺度注意力上下文聚合模块(MACA)和用于将不同尺度提取的特征合并为一个尺度上的信息的四个多尺度特征融合模块(MFF)组成,MFF+MACA模块自适应聚合图像的全局上下文信息;MACA模块提取的特征通过预测得到预测深度图,四个MFF模块通过预测得到四个残差深度图;
第4步、对第3步得到的预测深度图进行双线性插值上采样操作,得到上采样深度图;
第5步、采用RRM-Decoder部分对第3步得到的残差深度图和第4步得到的上采样深度图进行处理和融合,得到最终的深度图。
2.根据权利要求1所述的基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法,其特征在于,所述第3步中的MACA模块包括:空间注意力子模块(Spatial AttentionModule,SAM)和全局注意力子模块(GlobalAttention Module,GAM)。
3.根据权利要求1所述的基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法,其特征在于,四个多尺度特征融合模块MFF分别用于将不同尺度提取的特征合并为一个尺度上的信息,聚合所有特征中的尺度特征,作为每一个尺度预测融合特征图。
4.根据权利要求2所述的基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法,其特征在于,多尺度注意力上下文聚合模块MACA聚合全局上下文信息,其中的SAM子模块将SENet提取的低级特征进行Conv3×3处理后,通过从空间考虑像素的位置相关性,捕获特征的空间上下文信息,与经过GAM子模块处理后的特征进行Sum fusion处理,最后经过Conv3×3处理得到包含全局上下文信息的特征。
5.根据权利要求1所述的基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法 ,其特征在于,所述第5步中的估计复杂场景结构的残差金字塔解码器部分RRM-Decoder包括四个增强的残差细化模块RRM,四个RRM用于将经过MACA模块提取的包含全局上下文信息的特征上采样得到的深度图和经过MFF模块提取的包含多尺度特征预测得到的残差深度图通过RRM进行处理和融合,得到当前尺度下的精细深度图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军91550部队,未经中国人民解放军91550部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010865812.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐浸泡的高强快递箱
- 下一篇:一种半导体框架