[发明专利]图像特征提取方法、设备及可读存储介质在审
申请号: | 202310545790.0 | 申请日: | 2023-05-15 |
公开(公告)号: | CN116664858A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 张号逵;汤步洲 | 申请(专利权)人: | 深圳云天励飞技术股份有限公司 |
主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/44;G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 冉倩妮 |
地址: | 518000 广东省深圳市龙岗区园山街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 特征 提取 方法 设备 可读 存储 介质 | ||
1.一种图像特征提取方法,其特征在于,所述方法包括:
获取待提取特征的原始图像;
将所述原始图像输入至特征提取模型中进行特征提取,输出所述原始图像的第一图像特征;
其中,所述特征提取模型包括依次连接的多个局部特征提取结构和ViT结构;所述ViT结构用于根据第二图像特征与第三图像特征确定所述第一图像特征,所述第二图像特征是所述ViT结构的上一层结构输出的图像特征,所述第三图像特征是所述多个局部特征提取结构中的目标局部特征提取结构输出的图像特征,所述目标局部特征提取结构包括所述多个局部特征提取结构中除所述ViT结构的上一层结构之外的一个或多个,所述第三图像特征为对像素空间位置信息敏感的局部特征。
2.如权利要求1所述的方法,其特征在于,所述将所述原始图像输入至特征提取模型中进行特征提取,输出所述原始图像的第一图像特征,包括:
将所述原始图像输入至所述特征提取模型中,依次通过所述多个局部特征提取结构中的各个局部特征提取结构进行特征提取;
通过所述ViT结构,根据所述第二图像特征和所述第三图像特征,确定所述第一图像特征。
3.如权利要求2所述的方法,其特征在于,所述第二图像特征中的每个像素特征与所述第三图像特征中的Y个像素特征之间具有像素空间位置映射关系,Y为正整数;
所述通过所述ViT结构,根据所述第二图像特征和所述第三图像特征,确定所述第一图像特征,包括:
通过所述ViT结构,根据所述像素空间位置映射关系,将所述第二图像特征中的每个像素特征分别与所述第三图像特征中的Y个像素特征进行特征融合,得到第一注意力矩阵,所述第一注意力矩阵用于描述所述ViT结构基于所述第三图像特征,对所述第二图像特征中每个像素特征的关注程度;
通过所述ViT结构,根据所述第一注意力矩阵、所述第二图像特征以及所述第三图像特征,确定所述第一图像特征。
4.如权利要求3所述的方法,其特征在于,所述通过所述ViT结构,根据所述像素空间位置映射关系,将所述第二图像特征中的每个像素特征分别与所述第三图像特征中的Y个像素特征进行特征融合,得到第一注意力矩阵,包括:
通过所述ViT结构,根据所述第二图像特征,确定查询向量组,所述查询向量组用于指示第二图像特征中待查询的每个像素特征;
通过所述ViT结构,根据所述第三图像特征,确定第一键位向量组,所述第一键位向量组用于指示所述第三图像特征中每个像素特征的相关信息;
通过所述ViT结构,根据所述像素空间位置映射关系,将所述查询向量组包括的每个像素特征分别与所述第一键位向量组包括的Y个像素特征进行对齐;
通过所述ViT结构,根据对齐后的所述查询向量组和对齐后的所述第一键位向量组进行特征融合,得到所述第一注意力矩阵。
5.如权利要求4所述的方法,其特征在于,所述通过所述ViT结构,根据所述像素空间位置映射关系,将所述查询向量组包括的每个像素特征分别与所述第一键位向量组包括的Y个像素特征进行对齐,包括:
通过所述ViT结构,以Y个像素特征为单位,对所述第一键位向量组包括的所有像素特征进行重新排列,重新排列后的所述第一键位向量组中包括Z个像素单位特征,所述Z个像素单位特征中的每个像素单位特征包括Y个像素特征,Z为正整数;
通过所述ViT结构,根据重新排列后的所述第一键位向量组的向量维度,对所述查询向量组的向量维度进行调整,调整后的所述查询向量组的向量维度与重新排列后的所述第一键位向量组的向量维度相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术股份有限公司,未经深圳云天励飞技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310545790.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序