[发明专利]一种基于人脸识别与行人重识别的特定目标跟踪方法有效

申请号：	201811196063.3	申请日：	2018-10-15
公开（公告）号：	CN109344787B	公开（公告）日：	2021-06-08
发明（设计）人：	赵云波;林建武;李灏	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/08
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵;黄美娟
地址：	310014 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	基于人脸识别与行人重识别的特定目标跟踪方法，首先训练基于特征融合与三重损失函数的行人重识别神经网络，建立追踪目标人脸库，人脸识别模块提取人脸库的人脸特征向量；然后检测监控画面中的行人，人脸识别模块提取监控画面中行人人脸特征，与人脸库特征向量比对相似度，人脸识别成功则保存由行人重识别模型得到的行人特征至行人库。人脸识别失败则进行行人重识别，比对行人特征与行人特征库的相似度。行人重识别成功则保存相似度高的行人特征至行人库，行人重识别失败则利用上下帧的时空相关性确定行人的身份。最终实现在监控中对特定目标实时、有效的跟踪。
搜索关键词：	一种基于识别行人特定目标跟踪方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于人脸识别与行人重识别的特定目标跟踪方法，含有以下步骤：(1)训练基于特征融合与三重损失函数的行人重识别神经网络；步骤11：预训练ResNet50网络；利用ImageNet数据集作为训练数据集，训练1000分类的ResNet50网络，使ResNet50有理想的初始值，理想的初始值使行人重识别网络更容易收敛；步骤12：改进ResNet50网络；搭建基于ResNet50的特征融合网络；加载预训练模型参数，除去ResNet50的全连接层，将ResNet50中的res5a、res5b做全局平均池化，拼接得到两张特征图，用全连接层fc‑1024作用在这张拼接特征图上得到长度为1024的特征向量，记为mid‑level feature；同时，将ResNet50中的res5c也做全局平均池化，池化后展开得到长度为2048的特征向量，记为high‑level feature；将mid‑level feature和high‑level feature拼接得到长度为3072的特征向量，记为final feature；添加hard triplet损失函数；一种基于训练批量(Batch)的在线难样本采样方法，对于每一个训练批次，随机挑选P个ID的行人，每个行人随机挑选K张不同的图片，即一个batch含有P×K张图片；对于batch中的每一张图片a，挑选一个最难的正样本和一个最难的负样本和a组成一个三元组；定义和a为相同ID的图片集为A，剩下不同ID的图片图片集为B，则hard triplet损失表示为：m设定为0.3；hard triplet损失会计算a和batch中的每一张图片在特征空间final feature的欧式距离，然后选出与a距离最远即最不像的正样本p和距离最近即最像的负样本n来计算三元组损失，hard triplet损失效果比传统的三元组损失要好；添加softmax损失函数；softmax在分类问题上有非常好的表现，将每一个行人作为一个类别进行训练，Market1501训练集中共751个人，因此在final feature之后加一层全连接层，得到长度为751的fc‑class；softmax loss作用于fc‑class上；添加ring损失函数；一种原用于人脸识别的辅助损失函数，Ring loss将特征final feature限制到缩放后的单位圆上，同时能保持凸性，来得到更稳健的特征；其定义如下：这里λ取0.005，m为训练批次大小，即P*K，R是可训练参数，初始值为1；步骤13：预处理Market1501数据集；每一个训练批次，随机挑选P＝12个ID的行人，每个行人随机挑选K＝4张不同的图片，即一个batch含有P*K＝48张图片；图片随机裁剪成128*256大小，每张图片有概率地进行水平翻转，并归一化图片像素值；步骤14：训练行人重识别网络：加载预训练模型参数到本发明中修改过的ResNet50中，使用预处理过的数据集，三重损失值相加为最终损失值，利用Adam算法优化模型，迭代更新神经网络权重，直至模型收敛；最终，该模型在Market1501上取得rank1为92.2％的精度；(2)建立目标人脸库；步骤21：每个目标行人保存三张人脸图片，以“姓名+序号”的图片名保存；所有人保存在同一个文件夹下，一个人的库图片越多，检索起来越容易；步骤22：在该文件夹下建立一个文本文件，文件内容为图片名和对应的人名；(3)读取多源监控画面；步骤31：开启多个子线程，每个线程对应一个监控设备，设备个数可增减；步骤32：通过rtsp协议读取每个监控的每帧画面，传到服务器进行以下处理；(4)行人检测；步骤41：加载Yolo3模型，加载一次即可；步骤42：将整帧图片送入Yolo3，得到行人的坐标位置，根据坐标从原始画面中裁剪出每个行人，逐个行人进行以下步骤；(5)提取行人特征；步骤51：加载训练好的的行人重识别模型，加载一次即可；步骤52：将行人图片送入行人重识别模型，一个行人得到一行长度为3072的特征向量,即图1中的final feature，该特征向量作为行人特征，在以下步骤中使用；(6)人脸识别；步骤61：调用face‑recognition库的人脸识别模块提取人脸库的人脸特征向量，人脸库特征提取一次即可；步骤62：调用face‑recognition的人脸检测模块检测人脸，检测监控中行人面部是否可见，若面部检测成功，则继续以下步骤，否则，跳转至步骤(7)进行行人重识别；提取监控中行人的人脸特征向量A，分别求A与行人库中所有人脸相似度；假设人脸库中有特征向量记为B，其相似度计算公式为：其中，dist为A与B的欧式距离；步骤63：取其中相似度最高的值S；步骤64：若S大于等于阈值α，本发明中α取0.77，则认为S对应的人脸与该行人匹配；即人脸识别成功，与此同时，保存该行人的行人特征和标签到行人特征库中，行人特征由步骤(5)得到；人脸识别成功则跳过步骤(7)和步骤(8)；步骤65：若S小于阈值α，与该行人最相似的人脸相似度达不到阈值，即人脸识别失败，进入步骤(7)进行行人重识别；步骤66：由于人脸遮挡严重，或者行人背对监控，无法检测到人脸而导致的人脸识别失败，进入步骤(7)进行行人重识别；(7)行人重识别；步骤71：当人脸识别失败时，利用行人特征进行识别；将第五步得到的行人特征记为R，分别求R与行人特征库中每一个行人的欧式距离，欧式距离越小，相似度越高；步骤72：取R与行人库中最短的欧氏距离，记为x，设置行人重识别阈值β＝115，保存至行人库的阈值γ＝60；步骤73：若x<β，则该行人与最小欧式距离对应的标签相匹配，行人重识别成功，进入步骤4；否则，跳过步骤74进入步骤(8)；步骤74：若x<γ，表示该行人特征与行人库中某一特征非常相似，即该行人属于目标行人的概率非常大，保存该行人特征至行人特征库，跳过步骤(8)；(8)基于上下帧时空相关性进行跟踪；步骤81：记录上一帧每个行人的位置坐标和身份标签，没有身份标签的记为‘None’；步骤82：假设人脸识别和行人重识别不能识别某一行人，将该行人记为W；步骤83：计算行人W的位置框与上一帧每个行人位置框的重合度，重合度越高的，表示属于同一人的可能性越大；因此，认定行人W与上一帧中位置重合度最高的行人相匹配。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811196063.3/，转载请声明来源钻瓜专利网。

上一篇：目标识别方法、装置及计算机可读存储介质
下一篇：一种辅助搬运的可穿戴智能设备控制方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于人脸识别与行人重识别的特定目标跟踪方法有效

专利文献下载