[发明专利]行人再识别方法和装置、电子设备、存储介质、程序产品有效
申请号: | 201810848366.2 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109165563B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 陈大鹏;李鸿升;刘希慧;邵静;王晓刚 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 识别 方法 装置 电子设备 存储 介质 程序 产品 | ||
本申请实施例公开了一种行人再识别方法和装置、电子设备、存储介质、程序产品,获取待识别图像和候选图像集;利用特征提取网络对待识别图像和候选图像集中各候选图像进行特征提取,获得待识别图像对应的待识别中间特征和候选图像对应的候选中间特征,特征提取网络经图像特征和语言描述跨模态训练获得;基于待识别中间特征和候选中间特征从候选图像集中获得待识别图像对应的识别结果,利用了图像与描述该图像的语言之间天然的对应关系,以短语重建的方式进一步挖掘局部图片区域与名词短语之间相关性,增强了对图像特征学习的约束,提高了行人再识别视觉特征的质量,进而提高了行人再识别的准确度。
技术领域
本申请涉及计算机视觉技术,尤其是一种行人再识别方法和装置、电子设备、存储介质、程序产品。
背景技术
行人再识别是智能视频监控系统中的一项关键技术,它旨在通过对给定目标样本和后选样本之间的相似性进行度量,在大量后选样本中找出目标样本。随着深度神经网络的应用,用于行人再识别的视觉特征得到增强。为了进一步提高特征的判别能力,一些方法使用了辅助性数据;但仍存在以下问题:依赖额外的设备或模型,增加算法运行价格和时间的成本;或是对辅助数据定义复杂标注格式,增加了数据标注的人力成本。
发明内容
本申请实施例提供的一种行人再识别技术。
根据本申请实施例的一个方面,提供的一种行人再识别方法,包括:
获取待识别图像和候选图像集;
利用特征提取网络对待识别图像和候选图像集中各候选图像进行特征提取,获得所述待识别图像对应的待识别中间特征和所述候选图像对应的候选中间特征,所述特征提取网络经图像特征和语言描述跨模态训练获得;
基于所述待识别中间特征和所述候选中间特征从所述候选图像集中获得所述待识别图像对应的识别结果,所述识别结果包括至少一个候选图像。
可选地,所述基于所述待识别中间特征和所述候选中间特征从所述候选图像集中获得所述待识别图像对应的识别结果,包括:
所述待识别中间特征和所述候选中间特征分别经过平均池化层和全连接层获得待识别特征和候选特征;
基于所述待识别特征和所述候选特征从所述候选图像集中获得所述待识别图像对应的识别结果。
可选地,还包括:基于语言识别网络对与所述待识别图像相关的描述文字进行特征提取,获得语言特征;
基于所述语言特征对所述识别结果进行筛选,获得所述待识别图像对应的更新识别结果,所述更新识别结果包括至少一个候选图像。
可选地,所述基于所述语言特征对所述识别结果进行筛选,获得所述待识别图像对应的更新识别结果,包括:
基于所述语言特征与所述识别结果对应的至少一个所述候选中间特征之间的距离进行筛选;
获得距离小于或等于预设值的至少一个所述候选中间特征,将获得的所述候选中间特征对应的所述候选图像作为所述更新识别结果。
可选地,还包括:
基于所述语言识别网络对所述待识别图像相关的至少一个描述词语进行特征提取,获得词语特征,每个所述描述词语对应所述待识别图像中的至少一个部分;
基于所述词语特征对所述识别结果或所述更新识别结果进行筛选,获得所述待识别图像对应的目标识别结果,所述目标识别结果包括至少一个所述候选图像。
可选地,所述基于所述词语特征对所述识别结果或所述更新识别结果进行筛选,获得所述待识别图像对应的目标识别结果,包括:
基于所述词语特征与所述识别结果或所述更新识别结果对应的至少一个所述候选中间特征之间的距离进行筛选;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810848366.2/2.html,转载请声明来源钻瓜专利网。