[发明专利]行人特征的提取方法、装置、设备及介质有效
申请号: | 201911195366.8 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110909701B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王之港;王健;文石磊;丁二锐;孙昊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/40;G06V10/82;G06N3/0464 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 特征 提取 方法 装置 设备 介质 | ||
1.一种行人特征的提取方法,其特征在于,包括:
获取待处理的行人图像;
采用至少两个图像特征尺度,以及至少两个处理粒度对所述行人图像进行处理,得到与所述行人图像对应的至少两个行人图像特征子向量;
将所述至少两个行人图像特征子向量进行拼接,得到与所述行人图像对应的行人特征;
其中,采用至少两个图像特征尺度,和/或至少两个处理粒度,获取与所述行人图像对应的至少两个行人图像特征子向量,包括:
将所述行人图像输入至预先训练的行人再识别模型中,得到与所述行人图像对应的至少两个行人图像特征子向量;
其中,所述行人再识别模型包括至少两个计算分支,不同计算分支对应不同的图像特征尺度,和/或处理粒度;
其中,所述行人再识别模型具体包括:与第一图像特征尺度和第一处理粒度对应的第一计算分支,与第二图像特征尺度和第一处理粒度对应的第二计算分支,以及与第二图像特征尺度和第二处理粒度对应的第三计算分支;
其中,所述第一图像特征尺度大于所述第二图像特征尺度,所述第一处理粒度大于所述第二处理粒度;
其中,所述第一计算分支是出自行人再识别模型低层卷积的计算分支,用于对整个图像的全局特征进行提取;第二计算分支是出自行人再识别模型高层卷积的计算分支,用于对图像中行人的全局特征进行提取;第三分支特征是出自行人再识别模型高层卷积的计算分支,用于对图像中行人的局部关键特征进行提取。
2.根据权利要求1所述的方法,其特征在于,将所述行人图像输入至预先训练的行人再识别模型中,得到与所述行人图像对应的至少两个行人图像特征子向量,包括:
将所述行人图像输入至基础神经网络的低层部分,并将输出结果分别输入至所述行人再识别模型的第一计算分支进行处理,以及输入至所述基础神经网络的高层部分;
将所述基础神经网络的高层部分的输出结果分别输入至所述行人再识别模型的第二计算分支和第三计算分支进行处理;
得到所述行人再识别模型的第一计算分支输出的第一行人图像特征子向量、所述行人再识别模型的第二计算分支输出的第二行人图像特征子向量和所述行人再识别模型的第三计算分支输出的第三行人图像特征子向量。
3.根据权利要求2所述的方法,其特征在于,将输出结果输入至所述行人再识别模型的第一计算分支进行处理,包括:
对所述基础神经网络的低层部分的输出结果分别进行第一最大池化操作和第一平均池化操作,得到第一最大池化特征图和第一平均池化特征图;
将所述第一最大池化特征图和第一平均池化特征图进行第一逐像素相加操作,并将相加结果输入至第一卷积层,得到第一行人图像特征子向量。
4.根据权利要求2所述的方法,其特征在于,将所述基础神经网络的高层部分的输出结果输入至所述行人再识别模型的第二计算分支进行处理,包括:
对所述基础神经网络的高层部分的输出结果分别进行第二最大池化操作和第二平均池化操作,得到第二最大池化特征图和第二平均池化特征图;
将所述第二最大池化特征图和第二平均池化特征图进行第二逐像素相加操作,并将相加结果输入至第二卷积层,得到第二行人图像特征子向量。
5.根据权利要求2所述的方法,其特征在于,将所述基础神经网络的高层部分的输出结果输入至所述行人再识别模型的第三计算分支进行处理,包括:
对所述基础神经网络的高层部分的输出结果进行水平分块,得到多个中间特征图块;
对各所述中间特征图块分别进行块内最大池化操作和块内平均池化操作,得到第三最大池化特征图和第三平均池化特征图;
将所述第三最大池化特征图和第三平均池化特征图进行第三逐像素相加操作,并将相加结果输入至第三卷积层,得到第三行人图像特征子向量。
6.根据权利要求1-5任一项所述的方法,其特征在于,在将所述行人图像输入至预先训练的行人再识别模型中,得到与所述行人图像对应的至少两个行人图像特征子向量之前,还包括:
获取多个行人图像样本及其对应的标准行人图像特征子向量;
使用所述行人图像样本及其对应的标准行人图像特征子向量对预设的行人再识别模型进行训练,得到预先训练的行人再识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911195366.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资源打包方法、装置、服务器及存储介质
- 下一篇:一种生物技术研究用灭菌箱