[发明专利]基于神经网络的行人再识别方法和装置有效
申请号: | 201711124587.7 | 申请日: | 2017-11-14 |
公开(公告)号: | CN108875505B | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 肖琦琦;张弛 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 行人 识别 方法 装置 | ||
本公开提供一种基于神经网络的行人再识别方法和装置、以及计算机可读存储介质。所述行人再识别方法包括:接收包括所述行人的行人图像,以及比对图像;分别提取所述行人图像及所述比对图像中的特征;对比所述分别提取的特征,识别所述比对图像中是否存在所述行人,输出识别结果;其中,所述提取的特征表示图像中的纵向或横向上的图像特征。
技术领域
本公开涉及图像处理领域,更具体地,本公开涉及一种基于神经网络的行人再识别方法和装置、以及计算机可读存储介质。
背景技术
行人再识别指的是在不同的摄像机下识别出同一个人,其在视频监控、行人追踪等领域有很大的作用。一般的行人再识别策略主要是比较行人的衣服颜色,空间结构等底层简单特征来判断两张图是不是同一个人。但是这些简单特征不能很好的解决一些复杂的情况,比如背景的变化、光照的变化、人的姿态的转变、行人被遮挡等。此外,行人再识别一般在行人检测环节之后,行人检测的误差也会对行人再识别的准确性。
当前利用卷积神经网络提取行人特征来实现行人再识别的方法也已经被广泛应用。在提取完图像的特征以后,通常需要算一个距离矩阵来表示任意两张行人图像之间的相似性,常用的距离公式有欧式距离,夹角余弦距离等。但是这些简单的距离公式只考虑了特征的整体特性而忽略了局部特性,所以在一些比较困难的样本中表现不好。
发明内容
鉴于上述问题而提出了本公开。本公开提供了一种基于神经网络的行人再识别方法和装置、以及计算机可读存储介质。
根据本公开的一个方面,提供了一种基于神经网络的行人再识别方法,包括:接收包括所述行人的行人图像,以及比对图像;分别提取所述行人图像及所述比对图像中的特征;对比所述分别提取的特征,识别所述比对图像中是否存在所述行人,输出识别结果;其中,所述提取的特征表示图像中的纵向或横向上的图像特征。其中,分别提取所述行人图像及所述比对图像中的特征包括:通过所述神经网络,分别从所述行人图像及所述比对图像得到一个三维张量;对所述三维张量在横向上进行下采样得到一个二维张量,所述二维张量的两个维度分别代表纵向和频道,其中,纵向上的每个一维向量代表纵向上的图像特征;或者,对所述三维张量在纵向上进行下采样得到一个二维张量,所述二维张量的两个维度分别代表横向和频道,其中,横向上的每个一维向量代表横向上的图像特征。所述对比所述分别提取的特征包括使用动态规划方法计算所述行人图像的二维张量与比对图像的二维张量之间的距离或匹配概率。
根据本公开的另一个方面,提供了一种基于神经网络的行人再识别装置,包括:接收模块,用于接收包括所述行人的行人图像,以及比对图像;提取模块,用于分别提取所述行人图像及所述比对图像中的特征;识别模块,用于对比所述分别提取的特征,识别所述比对图像中是否存在所述行人,输出识别结果;其中,所述提取模块提取的特征表示图像中的纵向或横向上的图像特征。其中,所述提取模块具体用于:通过所述神经网络,分别从所述行人图像及所述比对图像得到一个三维张量;对所述三维张量在横向上进行下采样得到一个二维张量,所述二维张量的两个维度分别代表纵向和频道,其中,纵向上的每个一维向量代表纵向上的图像特征;或者,对所述三维张量在纵向上进行下采样得到一个二维张量,所述二维张量的两个维度分别代表横向和频道,其中,横向上的每个一维向量代表横向上的图像特征。其中,所述识别模块用于对比所述分别提取的特征具体为:使用动态规划方法计算所述行人图像的二维张量与比对图像的二维张量之间的距离或匹配概率。
根据本公开的又一个方面,提供了一种基于神经网络的行人再识别装置,所述行人再识别装置包括:存储器,用于存储非暂时性计算机可读指令;以及处理器,用于运行所述计算机可读指令,使得所述行人再识别装置执行上述基于神经网络的行人再识别方法。
根据本公开的再一个方面,提供了一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行上述基于神经网络的行人再识别方法。
要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并且意图在于提供要求保护的技术的进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711124587.7/2.html,转载请声明来源钻瓜专利网。