[发明专利]模型训练方法、行人再识别方法、装置和电子设备有效
申请号: | 202110372249.5 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112861825B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王之港;王健;孙昊;丁二锐 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/80;G06V10/74;G06V10/774 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 行人 识别 装置 电子设备 | ||
本公开提供了模型训练方法、行人再识别方法、装置和电子设备,涉及人工智能领域,具体为计算机视觉和深度学习技术,可用于智慧城市场景下。具体实现方案为:利用第一编码器对样本数据集中的第一行人图像和第二行人图像进行特征提取,得到第一行人图像的图像特征和第二行人图像的图像特征;对第一行人图像的图像特征和第二行人图像的图像特征进行融合,得到融合特征;利用第一解码器对融合特征进行特征解码,得到第三行人图像;将第三行人图像确定为第一行人图像的负样本图像,并利用第一行人图像及负样本图像将第一预设模型训练至收敛,得到行人再识别模型。利用本公开实施例可以提升模型区分外表相似但身份不同的行人的效果。
技术领域
本公开涉及人工智能领域,具体为计算机视觉和深度学习技术,可用于智慧城市场景下。
背景技术
行人再识别也被称为行人重识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。通常,可以利用大量样本图像对行人再识别模型进行有监督训练或无监督训练,利用训练至收敛的模型完成行人再识别任务。收敛的模型的性能依赖于样本图像的质量和难易程度。一般来说,模型能够对外表明显不同的行人进行区分,但难以区分外表相似但身份不同的行人。
发明内容
本公开提供了一种模型训练方法、行人再识别方法、装置和电子设备。
根据本公开的一方面,提供了一种模型训练方法,包括:
利用第一编码器对样本数据集中的第一行人图像和第二行人图像进行特征提取,得到第一行人图像的图像特征和第二行人图像的图像特征;
对第一行人图像的图像特征和第二行人图像的图像特征进行融合,得到融合特征;
利用第一解码器对融合特征进行特征解码,得到第三行人图像;
将第三行人图像确定为第一行人图像的负样本图像,并利用第一行人图像及负样本图像将第一预设模型训练至收敛,得到行人再识别模型。
根据本公开的另一方面,提供了一种行人再识别方法,包括:
利用行人再识别模型对目标图像以及候选行人图像分别进行特征提取,得到目标图像的行人特征以及候选行人图像的行人特征;其中,行人再识别模型是根据本公开任意实施例提供的模型训练方法得到的;
基于目标图像的行人特征以及候选行人图像的行人特征,确定目标图像与候选行人图像之间的相似度;
在相似度符合预设条件的情况下,将候选行人图像确定为目标图像的相关图像。
根据本公开的另一方面,提供了一种模型训练装置,包括:
第一编码模块,用于利用第一编码器对样本数据集中的第一行人图像和第二行人图像进行特征提取,得到第一行人图像的图像特征和第二行人图像的图像特征;
融合模块,用于对第一行人图像的图像特征和第二行人图像的图像特征进行融合,得到融合特征;
第一解码模块,用于利用第一解码器对融合特征进行特征解码,得到第三行人图像;
第一训练模块,用于将第三行人图像确定为第一行人图像的负样本图像,并利用第一行人图像及所述负样本图像将第一预设模型训练至收敛,得到行人再识别模型。
根据本公开的另一方面,提供了一种行人再识别装置,包括:
第二提取模块,用于利用行人再识别模型对目标图像以及候选行人图像分别进行特征提取,得到目标图像的行人特征以及候选行人图像的行人特征;其中,行人再识别模型是根据本公开任意实施例提供的模型训练方法得到的;
第三相似度模块,用于基于目标图像的行人特征以及候选行人图像的行人特征,确定目标图像与候选行人图像之间的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110372249.5/2.html,转载请声明来源钻瓜专利网。