[发明专利]图像处理方法、装置、电子设备及存储介质在审
申请号: | 202310340521.0 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116403061A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 黄高;宋士吉;潘旭冉;叶天竺;夏卓凡;谢之峰 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/82;G06V10/764;G06V10/26;G06N3/0464 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种图像处理方法、装置、电子设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取输入图像的图像向量;从所述图像向量中,获取多个查询矩阵;对所述图像向量进行移动处理,得到按行展开的键值矩阵;根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,每个所述查询矩阵对应的输出矩阵包含:所述图像向量对所述查询矩阵的注意力;根据所述多个输出矩阵,输出所述输入图像的图像处理结果。
技术领域
本公开涉及计算机视觉技术领域,特别是涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
自注意力在Vision Transformer模型(视觉转换模型)方面扮演着重要的角色。相关技术主要采用稀疏全局注意或窗口注意来降低Vision Transformer模型的计算复杂度。然而,稀疏全局注意在提取局部特征方面效率低下,窗口注意可能受制于一些人工设置。
相比之下,局部注意将每个查询的感受野限制在自己的相邻像素中,具有卷积和自注意力的优点,即局部归纳偏差和自适应特征提取。然而,当前的局部注意模块要么使用低效的Im2Col(image to column,图像到列)函数,要么依赖于特定的CUDA(ComputeUnified Device Architecture,一种运算平台)内核,因此不适用于没有CUDA支持的设备。
发明内容
鉴于上述问题,本公开实施例提供了一种图像处理方法、装置、电子设备及存储介质,以便克服上述问题或者至少部分地解决上述问题。
本公开实施例的第一方面,提供了一种图像处理方法,应用于图像处理模型,所述方法包括:
获取输入图像的图像向量;
从所述图像向量中,获取多个查询矩阵;
对所述图像向量进行移动处理,得到按行展开的键值矩阵;
根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,每个所述查询矩阵对应的输出矩阵包含:所述图像向量对该查询矩阵的自注意力;
根据所述多个输出矩阵,输出所述输入图像的图像处理结果。
可选地,所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
获取多个配置好的卷积核,所述多个配置好的卷积核表征不同的移动方向;
利用所述多个配置好的卷积核分别对所述图像向量进行深度可分离卷积,得到所述图像向量的多个卷积结果矩阵;
将所述图像向量的多个卷积结果矩阵按行展开,得到所述键值矩阵。
可选地,还包括:
获取多个可学习卷积核,所述多个可学习卷积核与所述多个配置好的卷积核一一对应;
利用所述多个可学习卷积核分别对所述图像向量进行卷积,得到所述图像向量的多个目标卷积结果矩阵;
将所述图像向量的所述多个卷积结果矩阵和所述多个目标卷积结果矩阵对应相加,得到所述图像向量的多个卷积结果之和矩阵;
所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
将所述图像向量的多个卷积结果之和矩阵按行展开,得到所述键值矩阵。
可选地,所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
对所述图像向量进行不同方向的移动,得到所述图像向量的多个移动结果矩阵;
将所述多个移动结果矩阵按行展开,得到所述键值矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310340521.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序