[发明专利]一种目标检索方法及相关装置在审
申请号: | 202210538456.8 | 申请日: | 2022-05-17 |
公开(公告)号: | CN114880513A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 鲁逸峰;周祥明;郑春煌;吴剑峰;韩加旭 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/44;G06V10/75;G06V10/80;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 杜晶 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检索 方法 相关 装置 | ||
1.一种目标检索方法,其特征在于,包括:
获取包含目标检索对象的待检索图像;
将所述待检索图像,输入至包含特征提取层和输出层的目标分类模型中,得到所述特征提取层输出的视觉特征,以及得到所述输出层输出的语义特征,所述语义特征用于表征所述目标检测对象的分类结果;
对所述语义特征和所述视觉特征进行特征融合,得到所述待检索图像对应的目标融合特征;
基于各候选图像和所述待检索图像各自对应的目标融合特征,从所述各候选图像中,确定与所述待检索图像匹配的至少一个目标图像。
2.如权利要求1所述的方法,其特征在于,所述对所述语义特征和所述视觉特征进行特征融合,得到所述待检索图像对应的目标融合特征,包括:
对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,并将所述初始融合特征,直接作为所述目标融合特征;或者,
对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,并获取与所述待检索图像关联的各待融合图像各自对应的初始融合特征,以及基于所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征,得到所述目标融合特征。
3.如权利要求2所述的方法,其特征在于,所述对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,包括:
按照指定的特征拼接顺序,对所述语义特征和所述视觉特征进行拼接;
基于所述语义特征和所述视觉特征各自对应的预设权重系数,对拼接得到的特征进行加权,得到所述待检索图像对应的初始融合特征。
4.如权利要求2所述的方法,其特征在于,所述基于所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征,得到所述目标融合特征,包括:
基于所述待检索图像和所述各待融合图像各自对应的权重系数,对所述待检索图像对应的初始融合特征以及所述各待融合图像各自对应的初始融合特征进行加权求和;
基于所述各待融合图像的个数,对加权求和后得到的融合特征进行平均,得到所述目标融合特征。
5.如权利要求2所述的方法,其特征在于,所述语义特征中包含各分类置信度和归一化信息;
所述对所述语义特征和所述视觉特征进行拼接,得到所述待检索图像对应的初始融合特征,包括:
基于所述语义特征中包含的所述归一化信息,对所述语义特征中包含的各分类置信度和所述视觉特征进行归一化处理,得到符合预设取值范围的各分类置信度和视觉特征;
对符合预设取值范围的各分类置信度和视觉特征进行拼接,得到所述待检索图像对应的初始融合特征。
6.如权利要求5所述的方法,其特征在于,所述各分类置信度包括各类别置信度,和/或,各属性置信度。
7.如权利要求2所述的方法,其特征在于,所述待检索图像为视频中的视频帧,所述视频还包含其他视频帧;
所述获取与所述待检索图像关联的各待融合图像各自对应的初始融合特征之前,还包括:
将包含所述目标检索对象,且播放时间早于所述视频帧的其他视频帧,作为与所述待检索图像关联的各待融合图像;
针对所述各待融合图像中的任意一个待融合图像,执行以下操作:
将所述任意一个待融合图像输入至所述目标分类模型中,得到所述任意一个待融合图像对应的视觉特征和语义特征,其中所述任意一个待融合图像的语义特征用于表征所述任意一个待融合图像的分类结果;
基于所述任意一个待融合图像对应的视觉特征和语义特征,得到所述任意一个待融合图像对应的初始融合特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210538456.8/1.html,转载请声明来源钻瓜专利网。