[发明专利]图像处理方法、装置、电子设备及存储介质在审
申请号: | 202310340521.0 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116403061A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 黄高;宋士吉;潘旭冉;叶天竺;夏卓凡;谢之峰 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/82;G06V10/764;G06V10/26;G06N3/0464 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 电子设备 存储 介质 | ||
1.一种图像处理方法,其特征在于,应用于图像处理模型,所述方法包括:
获取输入图像的图像向量;
从所述图像向量中,获取多个查询矩阵;
对所述图像向量进行移动处理,得到按行展开的键值矩阵;
根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,每个所述查询矩阵对应的输出矩阵包含:所述图像向量对该查询矩阵的自注意力;
根据所述多个输出矩阵,输出所述输入图像的图像处理结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
获取多个配置好的卷积核,所述多个配置好的卷积核表征不同的移动方向;
利用所述多个配置好的卷积核分别对所述图像向量进行深度可分离卷积,得到所述图像向量的多个卷积结果矩阵;
将所述图像向量的多个卷积结果矩阵按行展开,得到所述键值矩阵。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取多个可学习卷积核,所述多个可学习卷积核与所述多个配置好的卷积核一一对应;
利用所述多个可学习卷积核分别对所述图像向量进行卷积,得到所述图像向量的多个目标卷积结果矩阵;
将所述图像向量的所述多个卷积结果矩阵和所述多个目标卷积结果矩阵对应相加,得到所述图像向量的多个卷积结果之和矩阵;
所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
将所述图像向量的多个卷积结果之和矩阵按行展开,得到所述键值矩阵。
4.根据权利要求1所述的方法,其特征在于,所述对所述图像向量进行移动处理,得到按行展开的键值矩阵,包括:
对所述图像向量进行不同方向的移动,得到所述图像向量的多个移动结果矩阵;
将所述多个移动结果矩阵按行展开,得到所述键值矩阵。
5.根据权利要求1-4任一所述的方法,其特征在于,所述根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,包括:
将每个所述查询矩阵分别与所述键值矩阵相乘,得到每个所述查询矩阵对应的输出矩阵;
所述根据所述多个输出矩阵,输出所述输入图像的图像处理结果,包括:
将每个所述查询矩阵对应的输出矩阵进行相加并归一化,得到所述输入图像的图像特征;
根据所述图像特征,输出所述输入图像的图像处理结果。
6.根据权利要求1-4任一所述的方法,其特征在于,所述图像处理模型为图像分类模型,所述图像处理结果为图像分类结果;或,
所述图像处理模型为对象检测模型,所述图像处理结果为对象检测结果;或,
所述图像处理模型为语义分割模型,所述图像处理结果为语义分割结果。
7.一种图像处理装置,其特征在于,应用于图像处理模型,所述装置包括:
输入模块,用于获取输入图像的图像向量;
获取模块,用于从所述图像向量中,获取多个查询矩阵;
处理模块,用于对所述图像向量进行移动处理,得到按行展开的键值矩阵;
得到模块,用于根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,每个所述查询矩阵对应的输出矩阵包含:所述图像向量对所述查询矩阵的注意力;
输出模块,用于根据所述多个输出矩阵,输出所述输入图像的图像处理结果。
8.根据权利要求7所述的装置,其特征在于,所述处理模块具体用于执行:
获取多个配置好的卷积核,所述多个配置好的卷积核表征不同的移动方向;
利用所述多个配置好的卷积核分别对所述图像向量进行深度可分离卷积,得到所述图像向量的多个卷积结果矩阵;
将所述图像向量的多个卷积结果矩阵按行展开,得到所述键值矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310340521.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序