[发明专利]一种对象查询方法及装置在审
申请号: | 202211389853.X | 申请日: | 2022-11-08 |
公开(公告)号: | CN115618044A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 钟诚;郝兵 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/535;G06F16/538;G06F16/55;G06F16/33;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 姚璐华 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对象 查询 方法 装置 | ||
本申请公开了一种对象查询方法及装置,包括:获得与待查询对象对应的检索文本;基于检索文本,确定与待查询对象对应的对象属性特征;基于对象属性特征与目标属性特征集合中的属性标签的匹配程度,获得基于对象属性特征和/或与检索文本对应的多模态隐空间特征确定的目标查询模式;利用目标查询模式,在目标图像库中查询获得与待查询对象相匹配的目标图像查询结果。本申请基于对象属性特征和对应的多模态隐空间特征进行对象查询,提升了对象查询的精准性。
技术领域
本申请涉及检索技术领域,更具体的说是涉及一种对象查询方法及装置。
背景技术
随着互联网技术的发展,各种视频、图像数据呈爆发式增长,为了快速的从海量视频数据中检索出某个对象(例如,目标人物)的相关信息,各种检索方法应用而生。
目前的对象检索方法可以通过被检索对象的相关图像进行检索,但是这种方式要求已经有待查询图像,限制了检索的应用范围;还可以通过待检索对象的属性进行查询,但是这种方式待检索对象的属性信息不完整或者描述不准确时,容易出现检索偏差并限制了用户的使用范围。
发明内容
有鉴于此,本申请提供如下技术方案:
一种对象查询方法,包括:
获得与待查询对象对应的检索文本;
基于所述检索文本,确定与所述待查询对象对应的对象属性特征;
基于所述对象属性特征与目标属性特征集合中的属性标签的匹配程度,获得基于所述对象属性特征和/或所述检索文本对应的多模态隐空间特征确定的目标查询模式;
利用所述目标查询模式,在目标图像库中查询获得与所述待查询对象相匹配的目标图像查询结果。
可选地,所述目标查询模式至少包括以下一种:
若每一所述对象属性特征与目标属性特征集合中的各个属性标签均匹配,将所述目标模式确定为第一查询模式,所述第一查询模式表征利用所述对象属性特征进行查询的模式;
若部分所述对象属性特征与目标属性特征集合中的属性标签相匹配,将所述目标查询模式确定为第二查询模式,所述第二查询模式表征利用所述对象属性特征以及与所述检索文本对应的多模态隐空间特征进行查询的模式;
若所述对象属性特征与目标属性特征集合中的各个属性标签均不匹配,将所述目标查询模式确定为第三查询模式,所述第三查询模式表征利用与所述检索文本对应的多模态隐空间特征进行查询的模式;
其中,所述多模态隐空间特征表征将文本空间和图像空间映射到二者能够直接交互的中间模态空间。
可选地,所述目标查询模式为第一查询模式,其中,所述利用所述目标查询模式,在目标图像库中查询获得与所述待查询对象相匹配的目标图像查询结果,包括:
基于所述对象属性特征在目标图像库中进行查询,将所述目标图像库中图像属性特征与所述对象属性特征匹配度满足匹配条件的图像,确定为初始查询图像;
获得每一初始查询图像的图像特征,并基于所述图像特征和所述对象属性特征,对所述初始查询图像进行排序,获得目标图像查询结果。
可选地,所述基于所述图像特征和所述对象属性特征,对所述初始查询图像进行排序,获得目标图像查询结果,包括:
基于所述图像特征中的图像采集时间,确定每一初始查询图像对应的时间参数;
获得每一初始查询图像中与所述对象属性特征对应的图像区域,并基于所述图像区域的图像特征,确定图像质量参数;
基于每一初始查询图像中的图像特征与所述对象属性特征的匹配度,确定图像属性参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211389853.X/2.html,转载请声明来源钻瓜专利网。