[发明专利]图像检索模型的训练方法、图像检索方法及装置在审
申请号: | 202211572076.2 | 申请日: | 2022-12-08 |
公开(公告)号: | CN115795078A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 王倩芸;丁昆;刘朋樟;张屹峰;李阁;周梦迪;朱阳光;包勇军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检索 模型 训练 方法 装置 | ||
1.一种图像检索模型的训练方法,其特征在于,所述方法包括:
获取多个样本图像,各所述样本图像以其中包括的样本对象的所属类别进行标注;
将各所述样本图像输入图像检索模型中的目标检测网络,以获取对应样本图像中的样本图像块以及所述样本图像块的尺寸信息,所述样本图像块包括所述样本图像中的样本对象;
将各所述样本图像中的样本图像块以及所述样本图像块的尺寸信息,输入所述图像检索模型中的特征提取网络,以获取对应样本图像中样本对象的预测特征向量;
基于各所述样本图像中样本对象的预测特征向量以及所述样本对象的所属类别,确定损失值,并基于所述损失值,调整所述目标检测网络与所述特征提取网络的模型参数。
2.根据权利要求1所述的方法,其特征在于,所述将各所述样本图像中的样本图像块以及所述样本图像块的尺寸信息,输入所述图像检索模型中的特征提取网络,以获取对应样本图像中样本对象的预测特征向量,包括:
对于每个所述样本图像,将其中的样本图像块的尺寸信息,输入所述特征提取网络包括的第一尺寸特征提取模块,以基于所述尺寸信息获取所述样本图像块的第一尺寸特征;
将所述样本图像块输入所述特征提取网络包括的图像特征提取模块,以对所述样本图像块进行图像特征提取,得到所述样本图像块的图像特征向量;
将所述第一尺寸特征和所述图像特征向量,输入所述特征提取网络中与所述第一尺寸特征提取模块和所述图像特征提取模块连接的第一融合模块,以将所述第一尺寸特征和所述图像特征向量融合,得到所述样本图像中样本对象的预测特征向量。
3.根据权利要求2所述的方法,其特征在于,所述图像特征提取模块包括依次连接的图像处理子模块以及第一主干网络;
所述将所述样本图像块输入所述特征提取网络包括的图像特征提取模块,以对所述样本图像块进行图像特征提取,得到所述样本图像块的图像特征向量,包括:
将所述样本图像块输入所述图像处理子模块,以对所述样本图像块进行尺寸缩放,得到预设尺寸的第一图像块,并获取所述第一图像块对应的第一张量;
将所述第一张量输入所述第一主干网络,以基于所述第一张量进行图像特征提取,得到所述样本图像块的图像特征向量。
4.根据权利要求2所述的方法,其特征在于,所述第一融合模块包括依次连接的多层感知机子模块以及融合子模块;
所述将所述第一尺寸特征和所述图像特征向量,输入所述特征提取网络中与所述第一尺寸特征提取模块和所述图像特征提取模块连接的第一融合模块,以将所述第一尺寸特征和所述图像特征向量融合,得到所述样本图像中样本对象的预测特征向量,包括:
将所述第一尺寸特征输入所述多层感知机子模块,以对所述第一尺寸特征进行维度扩展,得到第二尺寸特征;
将所述第二尺寸特征和所述图像特征向量输入所述融合子模块,以将所述第二尺寸特征和所述图像特征向量融合,得到所述样本图像中样本对象的预测特征向量。
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述尺寸信息包括所述样本图像块的宽度和高度;所述基于所述尺寸信息获取所述样本图像块的第一尺寸特征,包括:
将所述样本图像块的宽度和高度,确定为所述第一尺寸特征;
或者,将所述样本图像块的宽度和高度的比值,确定为所述第一尺寸特征;
或者,确定各所述样本图像中样本图像块的宽度和高度的比值,并确定各所述比值的均值和标准差,基于所述比值、所述均值和所述标准差,确定所述第一尺寸特征;
或者,确定各所述样本图像中样本图像块的宽度和高度的对数比值,并确定各所述对数比值的均值和标准差,基于所述对数比值、各所述对数比值的均值和标准差,确定所述第一尺寸特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211572076.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增强钕铁硼磁体矫顽力的处理方法
- 下一篇:一种低密度多孔铜箔制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序