[发明专利]图像检索模型的训练方法、图像检索方法及装置在审
申请号: | 202211572076.2 | 申请日: | 2022-12-08 |
公开(公告)号: | CN115795078A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 王倩芸;丁昆;刘朋樟;张屹峰;李阁;周梦迪;朱阳光;包勇军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检索 模型 训练 方法 装置 | ||
本申请提出一种图像检索模型的训练方法、图像检索方法及装置,涉及深度学习、图像处理等人工智能技术领域,图像检索模型的训练方法包括:获取多个样本图像,各样本图像以其中包括的样本对象的所属类别进行标注;将各样本图像输入图像检索模型中的目标检测网络,以获取对应样本图像中的样本图像块以及样本图像块的尺寸信息;将各样本图像块以及尺寸信息,输入图像检索模型中的特征提取网络,以获取对应样本图像中样本对象的预测特征向量;基于各样本对象的预测特征向量以及所属类别,确定损失值,并基于损失值,调整目标检测网络与特征提取网络的模型参数。能够实现对图像检索模型的训练,且该图像检索模型在用于图像检索时的检索准确性高。
技术领域
本申请涉及深度学习、图像处理等人工智能技术领域,尤其涉及一种图像检索模型的训练方法、图像检索方法及装置。
背景技术
图像检索技术在多种领域具有广泛的应用。比如在电商领域的同款推荐、属性治理、类目合并等场景中,需要通过图像检索技术,检索与已知图像相似的图像。
相关技术中的图像检索技术,在模型训练阶段一般是将图像中的ROI(region ofinterest,感兴趣区域)缩放至固定尺寸后直接输入网络。由于图像的ROI的尺寸多样,其中ROI的尺寸反映了图像中主体对象的某些重要属性,比如ROI的孔径比(即宽度和高度的比例)反映了衣服的长短款,而将图像的ROI缩放至固定尺寸,会引起图像中主体对象的形变,从而上述将图像中的ROI缩放至固定尺寸后直接输入网络进行模型训练的方式,会导致模型无法学习到图像中主体对象的真实形态,在进行检索时容易检索到与已知图像不相关的图像,检索结果的准确性差。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
本申请提出一种图像检索模型的训练方法、图像检索方法及装置,以解决相关技术中训练得到的图像检索模型,在进行检索时容易检索到与已知图像不相关的图像,检索结果的准确性差的技术问题。
本申请第一方面实施例提出了一种图像检索模型的训练方法,包括:获取多个样本图像,各所述样本图像以其中包括的样本对象的所属类别进行标注;将各所述样本图像输入图像检索模型中的目标检测网络,以获取对应样本图像中的样本图像块以及所述样本图像块的尺寸信息,所述样本图像块包括所述样本图像中的样本对象;将各所述样本图像中的样本图像块以及所述样本图像块的尺寸信息,输入所述图像检索模型中的特征提取网络,以获取对应样本图像中样本对象的预测特征向量;基于各所述样本图像中样本对象的预测特征向量以及所述样本对象的所属类别,确定损失值,并基于所述损失值,调整所述目标检测网络与所述特征提取网络的模型参数。由此,能够实现对图像检索模型的训练,且该图像检索模型在用于图像检索时的检索准确性高。
本申请第二方面实施例提出了一种图像检索方法,包括:获取待检索的检索图像;将所述检索图像输入图像检索模型中的目标检测网络,以获取所述检索图像中的目标图像块以及所述目标图像块的尺寸信息,所述目标图像块包括所述检索图像中的目标对象;将所述检索图像中的目标图像块以及所述目标图像块的尺寸信息,输入所述图像检索模型中的特征提取网络,以获取所述目标对象的预测特征向量,其中,所述图像检索模型基于第一方面实施例所述的方法训练得到;基于所述目标对象的预测特征向量,从多个候选图像中确定目标图像。由此,提高了图像检索的准确性。
本申请第三方面实施例提出了一种图像检索模型的训练装置,包括:第一获取模块,用于获取多个样本图像,各所述样本图像以其中包括的样本对象的所属类别进行标注;第一处理模块,用于将各所述样本图像输入图像检索模型中的目标检测网络,以获取对应样本图像中的样本图像块以及所述样本图像块的尺寸信息,所述样本图像块包括所述样本图像中的样本对象;第二处理模块,用于将各所述样本图像中的样本图像块以及所述样本图像块的尺寸信息,输入所述图像检索模型中的特征提取网络,以获取对应样本图像中样本对象的预测特征向量;模型参数调整模块,用于基于各所述样本图像中样本对象的预测特征向量以及所述样本对象的所属类别,确定损失值,并基于所述损失值,调整所述目标检测网络与所述特征提取网络的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211572076.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增强钕铁硼磁体矫顽力的处理方法
- 下一篇:一种低密度多孔铜箔制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序