[发明专利]行人重识别的特征提取方法及装置、电子设备、存储介质在审
申请号: | 202011595976.X | 申请日: | 2020-12-28 |
公开(公告)号: | CN112597943A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 孙叶纳;周军 | 申请(专利权)人: | 北京眼神智能科技有限公司;北京眼神科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 成都维飞知识产权代理有限公司 51311 | 代理人: | 李鹏 |
地址: | 100082 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 识别 特征 提取 方法 装置 电子设备 存储 介质 | ||
本申请提供一种行人重识别的特征提取方法及装置、电子设备、计算机可读存储介质,该方法可以包括:将视频帧序列中每一视频帧作为已训练的头肩检测网络的输入,获得头肩检测网络输出的头肩检测框;基于头肩检测框回归得到行人检测框;将头肩检测框内的局部视频帧输入第一特征提取网络,获得头肩特征向量;将行人检测框内的局部视频帧输入第二特征提取网络,获得行人特征向量;对头肩特征向量和行人特征向量进行融合,获得行人外貌特征向量。通过本方案,可从视频帧中较少被遮挡的头肩部位提取出头肩特征向量融合到行人外貌特征向量中,使得行人外貌特征向量中可以包含更多有效的行人外貌特征,从而准确表征行人,提高行人追踪的稳定性和可靠性。
技术领域
本申请涉及图像处理技术领域,特别涉及一种行人重识别的特征提取方法及装置、电子设备、计算机可读存储介质。
背景技术
行人追踪技术被广泛应用于商城、银行、学校及安防等场景。行人追踪技术中通常可通过行人重识别(Person Re-identification,Person re-ID)技术提取行人的外貌特征,从而根据外貌特征来对行人进行识别和跟踪。在实际应用场景中,行人往往相互遮挡或者被场景中的物体所遮挡。在这种情况下,从监控图像中提取到的行人外貌特征会掺杂许多噪声,导致外貌特征无法准确地表征行人,降低了行人追踪的稳定性和可靠性。
发明内容
本申请实施例的目的在于提供一种行人重识别的特征提取方法及装置、电子设备、计算机可读存储介质,用于提取行人的外貌特征,使得提取到的外貌特征可以准确表征行人,提高行人追踪的稳定性和可靠性。
一方面,本申请提供了一种行人重识别的特征提取方法,包括:
将视频帧序列中每一视频帧作为已训练的头肩检测网络的输入,获得所述头肩检测网络输出的头肩检测框;
基于所述头肩检测框回归得到行人检测框;
将所述头肩检测框内的局部视频帧输入第一特征提取网络,获得头肩特征向量;
将所述行人检测框内的局部视频帧输入第二特征提取网络,获得行人特征向量;
对所述头肩特征向量和所述行人特征向量进行融合,获得行人外貌特征向量。
在一实施例中,所述头肩检测网络通过如下方式训练得到:
将样本数据集中的样本图像作为目标检测网络的输入,获得所述目标检测网络输出的样本头肩预测框;其中,所述样本图像携带已标注的头肩标签框;
基于所述样本头肩预测框和所述头肩标签框之间的差异,调整所述目标检测网络的网络参数;
重复上述过程,直至所述目标检测网络收敛,获得所述头肩检测网络。
在一实施例中,所述头肩检测框以中心点坐标、宽度和高度表示;
所述基于所述头肩检测框回归得到行人检测框,包括:
将所述头肩检测框在垂直方向向下移动达到指定距离;
将移动后的所述头肩检测框在中心点不变的情况下,高度指定倍数,获得所述行人检测框。
在一实施例中,所述第二特征提取网络为已训练的多粒度网络;
所述将所述行人检测框内的局部视频帧输入第二特征提取网络,获得行人特征向量,包括:
将所述行人检测框内的局部视频帧输入所述多粒度网络的主干网络,获得所述主干网络输出的基础图像特征;
将所述基础图像特征输入所述多粒度网络的全局特征提取网络,获得第一全局特征向量;
将所述基础图像特征输入所述多粒度网络的第一区域特征提取网络,获得第二全局特征向量、第一区域特征向量和第二区域特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京眼神智能科技有限公司;北京眼神科技有限公司,未经北京眼神智能科技有限公司;北京眼神科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011595976.X/2.html,转载请声明来源钻瓜专利网。