[发明专利]一种图像特征学习方法、装置、设备及可读存储介质在审
申请号: | 202310211203.4 | 申请日: | 2023-03-07 |
公开(公告)号: | CN116363476A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 朱玟谦;刘程;杨颖;张澳;刘会凯 | 申请(专利权)人: | 岚图汽车科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06N3/045;G06N3/0464;G06N3/048 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 罗成 |
地址: | 430000 湖北省武汉市经济技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 特征 学习方法 装置 设备 可读 存储 介质 | ||
本申请涉及一种图像特征学习方法、装置、设备及可读存储介质,涉及计算机视觉技术领域,包括基于浅层特征生成网络对原始特征图进行初步卷积和池化,以生成浅层特征图;基于空间感知残差网络对浅层特征图进行空间感知采样学习,以得到空间感知特征图,空间感知残差网络包括至少一个空间感知残差单元,每个空间感知残差单元包括残差块和空间感知自注意力模块,残差块用于对浅层特征图进行残差处理以得到残差特征图,空间感知自注意力模块基于预设的空间感知可变采样策略对残差特征图中的十字区域进行空间感知学习,以得到空间感知特征图。本申请通过空间可变采样实现十字交叉自注意力模块的区域选择,增强了模型对图像空间变换的表达鲁棒性。
技术领域
本申请涉及计算机视觉技术领域,特别涉及一种图像特征学习方法、装置、设备及可读存储介质。
背景技术
图像特征表达(Image Feature Embedding)是计算机视觉领域最重要的研究任务和范畴之一,图像特征表达是使用机器学习的方法构建图像特征描述算子,将原始图像数据映射至图像特征数据(如图像特征张量)的技术。该技术根据不同的任务导向,将样本从图像空间转换至特征空间中,利用特征空间中样本的分布特征实现既定的视觉计算任务。图像特征表达作为极其关键且不可或缺的技术环节已被广泛应用在如图像分类、目标检测以及语义分割等重要领域,且其输出的图像特征结果将直接影响到整个视觉计算任务的性能表现。
相关技术中,由于卷积滤波器固定空间滤波模型和Transformer模型中自注意力机制的全局计算架构设计的快速发展,基于卷积和Transformer的图像特征表达方法在视觉计算领域大放异彩的同时,也愈发凸显其局限性,具体的:由于卷积滤波固定的空间采样设计,以致卷积操作只能从特定的像素位置分布模式中获取深度特征,导致其缺少对图像空间变换(如仿射变换、透视变换等)的内在感知机制,以致在处理存在局部形变和空间变换的图像时,无法鲁棒表达图像的深度语义特征。例如图像不同空间位置上可能存在大小和形变程度不同,但纹理相同的局部图案,固定的采样模式和池化操作难以准确区分与鲁棒表达这些特征。
发明内容
本申请提供一种图像特征学习方法、装置、设备及可读存储介质,以增强对图像空间变换的表达鲁棒性。
第一方面,提供了一种图像特征学习方法,包括以下步骤:
基于浅层特征生成网络对原始特征图进行初步卷积和池化,以生成浅层特征图;
基于空间感知残差网络对浅层特征图进行空间感知采样学习,以得到空间感知特征图,所述空间感知残差网络包括至少一个空间感知残差单元,每个空间感知残差单元包括残差块和空间感知自注意力模块,残差块用于对浅层特征图进行残差处理以得到残差特征图,空间感知自注意力模块基于预设的空间感知可变采样策略对残差特征图中的十字区域进行空间感知学习,以得到空间感知特征图。
一些实施例中,所述空间感知自注意力模块基于预设的空间感知可变采样策略对残差特征图中的十字区域进行空间感知学习,以得到空间感知特征图,包括:
将所述残差特征图分别映射为基础特征张量和空间感知张量SP,所述基础特征张量包括特征张量Q、特征张量K和特征张量V,所述空间感知张量SP中存在与基础特征张量中每一位置对应的二维向量spu,spu表示基础特征张量中每一位置在采样阶段的位移量;
对基础特征张量中各个位置对应的基础十字区域进行定义;
基于所述基础十字区域和所述空间感知张量SP对所述基础特征张量中各个位置对应的空间感知十字区域进行定义;
分别对特征张量Q中各个位置以及在特征张量K中与各个位置对应的空间感知十字区域进行交叉映射处理,得到关联张量集合P;
分别对关联张量集合P中的每一个关联张量进行归一化处理,得到归一化系数张量集合L;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岚图汽车科技有限公司,未经岚图汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310211203.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序