[发明专利]一种基于先验候选框选择策略的行人搜索方法和装置有效
申请号: | 201810608363.1 | 申请日: | 2018-06-13 |
公开(公告)号: | CN109165540B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 丁润伟;石伟;刘宏 | 申请(专利权)人: | 深圳市感动智能科技有限公司;北京大学深圳研究生院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/762;G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 先验 候选 选择 策略 行人 搜索 方法 装置 | ||
本发明公开一种基于先验候选框选择策略的行人搜索方法和装置。该方法包括:根据训练集中所有行人边界框的长和宽构建行人候选框特征向量,包含长宽比和长度两个元素;通过k‑means++算法选出初始化聚类中心;利用k‑means算法进行迭代聚类,得到聚类后的先验候选框;将训练集中的行人图像输入预先定义的行人搜索网络,利用先验候选框生成候选行人并识别出行人的身份,通过训练得到训练好的行人搜索网络;将行人探针和监控场景图像分别通过训练好的行人搜索网络,得到行人探针特征以及监控图像中候选行人的特征,通过计算该两种特征的相似性获得行人探针所在的监控图像及其具体位置。本发明能够有效提高行人搜索的精度和速度。
技术领域
本发明属于机器人视觉技术和智能监控领域,具体涉及一种基于先验候选框选择策略的行人搜索方法和装置;通过构建行人候选框特征向量以及设计新的距离度量函数,并利用词袋模型对行人候选框特征向量聚类,为行人搜索提供合适的初始候选框,可近一步减少行人检测的回归时间和提高后期行人识别的精度。
背景技术
行人搜索是一项同时解决行人检测和行人重识别的关键技术,可以被应用于人机交互、智能监控和视频分析等方面。然而,行人检测算法的性能仍然受限,所引起的行人误检、漏检及误报都会对后期的行人重识别产生严重的影响。因此,提高行人搜索系统中行人检测的精度和速度,对行人搜索总体性能的提高尤为重要。
现有的一类方法(T.Xiao,S.Li,B.Wang,L.Lin,and X.Wang,“Joint detectionand identification feature learning for person search,”in IEEE Conference onComputer Vision and Pattern Recognition(CVPR),pp.3376–3385,2017.)是通过一个端到端的深度学习网络去联合优化行人检测和行人重识别,在反向传播的过程中,两部分的网络权重可以一起被更新。但是,该方法直接将目标检测的网络迁移到行人搜索上,而目标检测中目标尺寸和行人尺寸大不相同,由于两个问题本身的场景不一样,所以这类方法在模型上会引入较大的误差。另一种方式(H.Liu,J.Feng,Z.Jie,K.Jayashree,B.Zhao,M.Qi,J.Jiang and S.Yan,“Neural person search machines,”in IEEE InternationalConference on Computer Vision(ICCV),2017.)利用行人探针的信息和注意机制不断地匹配行人探针和监控场景图像,这种方法的检测精度相比前者有提升,但是其算法效率低,测试阶段每搜索一个行人,都需遍历整个监控场景库,不适合应用于实际的监控场景。
发明内容
针对现有技术存在的技术问题,本发明的目的是提供一种基于先验候选框选择策略的行人搜索方法和装置,通过利用无监督的方式对行人候选框进行预先的选择,可以有效提高行人搜索的精度和速度。
本发明采用的技术方案如下:
一种基于先验候选框选择策略的行人搜索方法,包括以下步骤:
1)输入训练集中所有行人边界框的长、宽;
2)计算每个行人边界框的长宽比;
3)构建行人候选框特征向量,包含长宽比和长度两个元素;
4)对构建的行人候选框特征向量,通过k-means++算法选出初始化聚类中心;
5)利用k-means算法对行人候选框特征向量向初始化聚类中心进行迭代聚类,得到聚类后的先验候选框;
6)将训练集中的行人图像输入预先定义的行人搜索网络,利用步骤5)得到的先验候选框生成候选行人,并输入识别网络识别出行人的身份(这里的身份是指每个行人被分配的不同编号,行人搜索的最终目的就是要区分不同的人,能够在大量监控数据中,找到待查找的人),通过整个训练集的训练得到训练好的行人搜索网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市感动智能科技有限公司;北京大学深圳研究生院,未经深圳市感动智能科技有限公司;北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810608363.1/2.html,转载请声明来源钻瓜专利网。