[发明专利]一种基于先验候选框选择策略的行人搜索方法和装置有效
申请号: | 201810608363.1 | 申请日: | 2018-06-13 |
公开(公告)号: | CN109165540B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 丁润伟;石伟;刘宏 | 申请(专利权)人: | 深圳市感动智能科技有限公司;北京大学深圳研究生院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/762;G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 先验 候选 选择 策略 行人 搜索 方法 装置 | ||
1.一种基于先验候选框选择策略的行人搜索方法,包括以下步骤:
1)输入训练集中所有行人边界框的长、宽;
2)计算每个行人边界框的长宽比;
3)构建行人候选框特征向量,包含长宽比和长度两个元素;
4)对构建的行人候选框特征向量,通过k-means++算法选出初始化聚类中心;
5)利用k-means算法对行人候选框特征向量向初始化聚类中心进行迭代聚类,得到聚类后的先验候选框;
6)将训练集中的行人图像输入预先定义的行人搜索网络,利用步骤5)得到的先验候选框生成候选行人并识别出行人的身份,通过训练集的训练得到训练好的行人搜索网络;
7)将行人探针和监控场景图像分别通过训练好的行人搜索网络,得到行人探针特征以及监控图像中候选行人的特征,通过计算该两种特征的相似性获得行人探针所在的监控图像及其具体位置;其中行人探针是指待查找的单张行人图像;
其中,步骤5)采用候选框距离匹配度量方法进行k-means聚类,所述候选框距离匹配度量方法包含待聚类的行人候选框特征向量fi与聚类中心fcenter,j的欧式距离,以及待聚类的行人候选框与聚类中心的重叠程度,具体如下:
其中,IOU(·)表示两个候选框的重叠程度,聚类得到的K个聚类中心即为行人候选框,将所有行人候选框的长度取均值,得到表示不同行人候选框的尺度,将计算得到的该尺度与行人候选框的长宽比lcenter,j串联,最终得到K个先验候选框的参数:
2.如权利要求1所述的方法,其特征在于,步骤6)所述行人搜索网络的训练过程包括:
6.1)将训练集图像通过主干网络,所述主干网络提取行人检测和识别的公共特征,得到特征图;
6.2)将所述特征图送入区域生成网络,所述区域生成网络用于生成行人候选框;所述区域生成网络中行人候选框的初始化尺寸和尺度即是步骤5)得到的先验候选框的尺寸和尺度;
6.3)将所述行人候选框映射到步骤6.1)得到的特征图,得到候选行人的特征,然后通过感兴趣区域池化层将所有的候选行人的特征变换为同样的空间大小;
6.4)将步骤6.3)得到的特征送入识别网络,然后将通过识别网络得到的特征接入损失函数进行训练;
6.5)利用梯度下降方法,通过迭代训练,得到最终训练好的行人搜索网络。
3.如权利要求2所述的方法,其特征在于,步骤6.2)将步骤5)聚类得到的K种先验候选框的尺寸和尺度,两两组合得到K2种,即对特征图的每个像素点生成个K2行人候选框。
4.如权利要求2或3所述的方法,其特征在于,所述区域生成网络包括:一个3×3的卷积层,用于提取适合行人检测的特征;一个含18个滤波器的1×1卷积层,用于预测候选框的类别;一个含36个滤波器的1×1卷积层,用于预测候选框的位置;损失函数,用于计算行人候选框的类别和位置与真实标签的差异,通过不断更新参数以减小差异,实现网络的训练。
5.如权利要求1所述的方法,其特征在于,步骤7)计算所述两种特征的余弦距离作为相似性得分,进而获得行人探针所在的监控图像及其具体位置。
6.如权利要求1所述的方法,其特征在于,步骤7)所述监控场景图像为原始的监控图像,没有对监控图像中的行人进行任何剪切。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市感动智能科技有限公司;北京大学深圳研究生院,未经深圳市感动智能科技有限公司;北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810608363.1/1.html,转载请声明来源钻瓜专利网。