[发明专利]一种目标检索方法及相关装置在审
申请号: | 202210538456.8 | 申请日: | 2022-05-17 |
公开(公告)号: | CN114880513A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 鲁逸峰;周祥明;郑春煌;吴剑峰;韩加旭 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/44;G06V10/75;G06V10/80;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 杜晶 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检索 方法 相关 装置 | ||
本申请涉及计算机技术领域,特别涉及一种目标检索方法及相关装置,用于提高检索效率和准确率,该方法为:获取包含目标检索对象的待检索图像后,将待检索图像,输入至目标分类模型中,目标分类模型中包含特征提取层和输出层,从特征提取层获取视觉特征,以及从输出层获取语义特征,然后,对语义特征和视觉特征进行特征融合,得到待检索图像对应的目标融合特征,进而基于目标融合特征,从各候选图像中,确定与待检索图像匹配的目标图像。
技术领域
本申请涉及图像处理技术领域,特别涉及一种目标检索方法及相关装置。
背景技术
随着计算机技术的不断发展,视觉目标检索应用于越来越多的场景中,视觉目标检索通过对待检测图像的特征向量,与数据库中的海量图像的特征向量进行比较,从海量图像中确定出与待检测图像相似的目标图像。
相关技术中,通常采用机器学习模型,获得待检测图像的特征向量,然而,通过机器学习模型获得的特征向量的可解释性较差,且特征向量的特征维度取决于模型输出维度,难以对训练集以外的特征类型进行较好的适配。例如,采用猫的图像进行训练的分类模型,并不适用于狗的分类和检索,通用性较差,若想检索其它类别物体,还需要重新训练,同时降低了检索效率。
发明内容
本申请提供了一种目标检索方法及相关装置,用以提升特征的鲁棒性和场景适应性,提高检索效率和准确率。
本申请实施例提供的具体技术方案如下:
第一方面,一种目标检索方法,包括:
获取包含目标检索对象的待检索图像;
将所述待检索图像,输入至包含特征提取层和输出层的目标分类模型中,得到所述特征提取层输出的视觉特征,以及得到所述输出层输出的语义特征,所述语义特征用于表征所述目标检测对象的分类结果;
对所述语义特征和所述视觉特征进行特征融合,得到所述待检索图像对应的目标融合特征;
基于各候选图像和所述待检索图像各自对应的目标融合特征,从所述各候选图像中,确定与所述待检索图像匹配的至少一个目标图像。
可选的,所述对所述语义特征和所述视觉特征进行特征融合,得到所述待检索图像对应的目标融合特征,包括:
对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,并将所述初始融合特征,直接作为所述目标融合特征;或者,
对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,并获取与所述待检索图像关联的各待融合图像各自对应的初始融合特征,以及基于所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征,得到所述目标融合特征。
可选的,所述对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,包括:
按照指定的特征拼接顺序,对所述语义特征和所述视觉特征进行拼接;
基于所述语义特征和所述视觉特征各自对应的预设权重系数,对拼接得到的特征进行加权,得到所述待检索图像对应的初始融合特征。
可选的,所述基于所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征,得到所述目标融合特征,包括:
基于所述待检索图像和所述各待融合图像各自对应的权重系数,对所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征进行加权求和;
基于所述各待融合图像的个数,对加权求和后得到的融合特征进行平均,得到所述目标融合特征。
可选的,所述语义特征中包含各分类置信度和归一化信息;所述对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210538456.8/2.html,转载请声明来源钻瓜专利网。