[发明专利]基于深度学习的监控视频中人员的识别跟踪方法和装置在审
申请号: | 202011487218.6 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112580494A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 宋波 | 申请(专利权)人: | 北京影谱科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 姜楠楠 |
地址: | 100000 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 监控 视频 人员 识别 跟踪 方法 装置 | ||
本申请公开了一种的基于深度学习的监控视频中人员的识别跟踪方法和装置,涉及识别跟踪领域。该方法包括:将数据集输入MobileNet模型,使用人的多个属性作为特征输入进行训练,得到与所述多个属性对应的类别;当进行人员识别跟踪时,将监控视频和目标图片输入到RCNN模型中,以所述目标图片所包含的待跟踪对象为查询条件,根据所述MobileNet模型得到的类别对所述监控视频中的对象进行识别跟踪,并输出跟踪结果。该装置包括:训练模块和跟踪模块。本申请相比于单一特征训练识别的方法,识别跟踪的准确率提高很多,同时也提高了搜索效率。
技术领域
本申请涉及识别跟踪领域,特别是涉及一种基于深度学习的监控视频中人员的识别跟踪方法和装置。
背景技术
目前,对视频中的人员进行跟踪和识别有多种方法可以实现。Jing等人在给定的一组图像中对戴眼镜的人使用了一种名为变形轮廓的约束优化过程,其中使用了一个三步程序即边缘地图生成器,过滤不必要的边缘点,优化眼镜的形状和位置。Lorenzo等人使用的直方图面向梯度(HOG)和本地二进制模式(LBP)对服装的不同属性进行分类,如袖子的长度、面料的颜色、面料上的图案、面料上有无衣领等。Seo等人使用基于CNN的架构来实现对服装图像进行分类。
现有的方法大多数都使用一个人的单个特征来进行训练,并基于单个特征来实现人员的检测,如基于单独的服装样式或单独的眼镜来进行检测,这种基于单一特征的检测效率比较低,准确率也不高。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种基于深度学习的监控视频中人员的识别跟踪方法,包括:
将数据集输入MobileNet模型,使用人的多个属性作为特征输入进行训练,得到与所述多个属性对应的类别;
当进行人员识别跟踪时,将监控视频和目标图片输入到RCNN(Region-CNN,区域卷积神经网络)模型中,以所述目标图片所包含的待跟踪对象为查询条件,根据所述MobileNet模型得到的类别对所述监控视频中的对象进行识别跟踪,并输出跟踪结果。
可选地,使用人的多个属性作为特征输入进行训练,得到与所述多个属性对应的类别,包括:
使用性别、衬衫样式和眼睛状态作为特征输入进行训练,得到与这三个属性对应的八个类别。
可选地,以所述目标图片所包含的待跟踪对象为查询条件,根据所述MobileNet模型得到的类别对所述监控视频中的对象进行识别跟踪,包括:
以所述目标图片所包含的待跟踪对象为查询条件,根据所述MobileNet模型得到的类别,使用CNN(Convolutional Neural Networks,卷积神经网络)对所述监控视频提取特征后送入SVM(Support Vector Machines,支持向量机)分类器中进行判别,然后使用回归器修正边框。
可选地,所述方法还包括:
所述RCNN模型使用选择性搜索算法,通过不同尺寸的窗口查看视频帧,每种尺寸的窗口都基于纹理、颜色和强度对来定位待跟踪对象的位置。
可选地,输出跟踪结果,包括:
通过感兴趣区域的边界框RoI bbox来输出跟踪结果。
根据本申请的另一个方面,提供了一种基于深度学习的监控视频中人员的识别跟踪装置,包括:
训练模块,其配置成将数据集输入MobileNet模型,使用人的多个属性作为特征输入进行训练,得到与所述多个属性对应的类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京影谱科技股份有限公司,未经北京影谱科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011487218.6/2.html,转载请声明来源钻瓜专利网。