[发明专利]一种基于深度学习的监控视频多目标分类检索方法及系统有效
申请号: | 201810923212.5 | 申请日: | 2018-08-14 |
公开(公告)号: | CN109241349B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 杨利红;张俊;姜少波;甘彤;商国军;程剑;刘海涛;李阳;胡博;张琦珺;连捷;陈曦 | 申请(专利权)人: | 中国电子科技集团公司第三十八研究所 |
主分类号: | G06F16/738 | 分类号: | G06F16/738;G06F16/78;G06V20/52;G06K9/62;G06V10/75;G06V10/774;G06V10/764 |
代理公司: | 合肥昊晟德专利代理事务所(普通合伙) 34153 | 代理人: | 王林 |
地址: | 230000 安徽省合*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 监控 视频 多目标 分类 检索 方法 系统 | ||
1.一种基于深度学习的监控视频多目标分类检索方法,其特征在于,包括以下步骤:
(1)提取待检索目标:输入待检索图像,通过自动检测或人工抠取的方式选择待检索目标,并明确其类别;
自动检测时,采用深度学习目标检测模型获取输入图像中所有人或车的精确位置及具体类别,用户根据需要选择其中的某个目标进行检索;人工抠取时,由用户从输入图像中框选待检索的目标及其所在位置,并选择其对应的类别;
(2)提取深度特征:利用深度学习特征提取模型提取待检索目标的深度特征;所述特征提取模型的卷积神经网络包括输入层、19个卷积层、5个池化层和输出层,可提取人、小汽车、面包车、大巴车、卡车、摩托车六个类别的深度特征,维度均为1024;
(3)目标检索:根据待检索目标的类别,将待检索目标的深度特征与检索数据库中同类目标的深度特征进行比对,得到与之最为相似的目标;
(4)检索结果展示:检索结果按照相似度从高到低展示,选取某个检索结果,可静态展示其在关键帧中的具体位置,并可动态展示其在监控视频中的运行轨迹;
所述目标检测模型的卷积神经网络包括输入层、22个卷积层、5个池化层和输出层,检测类别包括人、小汽车、面包车、大巴车、卡车、摩托车六类,训练使用的损失函数如下:
训练样本被划分为13×13个单元格,每个单元格预测9个目标,其中与该单元格处标记目标重叠面积最大的预测目标的为1,其它8个预测目标的为0;如果预测目标位置不包含标记目标,则其为1,反之,其为0,xi,yi,wi,hi,Ci分别代表为1预测目标的中心点x坐标、中心点y坐标、宽度、高度、置信度;分别代表标记目标的中心点x坐标、中心点y坐标、宽度、高度、置信度,class代表检测的目标类别,pi(c)为每个类别的预测概率,为每个类别的标记概率;
在提取目标之前,首先训练深度学习模型,然后构建检索视频库,所述训练深度学习模型包括目标检测模型和特征提取模型;训练深度学习模型为:搜集大量包括人或车类目标的监控视频图片,图片涵盖白天和夜晚等多时段不同光照条件、晴天和雨天等不同环境、治安监控和交通监控等不同场景,车分为小汽车、面包车、大巴车、卡车、摩托车五个类别,每个图片均标记出其中的人或各类车的位置及具体类别,形成对应每个图片的标记文件,并截取各个目标的抠图保存;
将所有图片中目标的抠图及其类别输入到深度卷积神经网络中训练得到深度学习的特征提取模型;将图片及记录其中人或各类车精确位置和具体类别的标记文件输入到深度卷积神经网络中训练得到深度学习的目标检测模型;
所述构建检索视频库为:通过运动分析提取监控视频中所有运动目标的运行轨迹和包含运动目标的关键帧;利用深度学习模型提取关键帧中人或车类目标的精确位置、具体类别和深度特征,保存到检索数据库中;将人或车类目标与运动目标匹配得到对应的运行轨迹,保存到检索数据库中;具体过程如下:
(101)导入待检索监控视频,通过逐帧运动分析得到每个监控视频中的所有运动目标并跟踪其运行轨迹,同时提取包含运动目标的关键帧;
(102)利用深度学习目标检测模型提取关键帧中的人或车类目标,得到其精确位置和具体类别,将每个目标对应的关键帧、位置、类别保存到检索数据库中;
(103)利用深度学习特征提取模型提取每个人或车类目标的深度特征,保存到检索数据库中;
(104)将提取出的人或车与运动分析得到的运动目标进行匹配,得到其对应的运行轨迹,保存到检索数据库中。
2.根据权利要求1所述的一种基于深度学习的监控视频多目标分类检索方法,其特征在于,检索数据库保存监控视频中所有人或车类目标所在的关键帧、目标位置、目标类别和目标深度特征。
3.根据权利要求1所述的一种基于深度学习的监控视频多目标分类检索方法,其特征在于,步骤(3)中,选择待检索目标时,自动检测方式采用深度学习目标检测模型获取待检索图像中所有人或车类目标的精确位置及具体类别,用户根据需要选择其中的某个目标进行检索;人工抠取方式由用户从待检索图像中框选待检索的目标及其所在位置,并选择其对应的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十八研究所,未经中国电子科技集团公司第三十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810923212.5/1.html,转载请声明来源钻瓜专利网。