[发明专利]一种基于视频流的抽烟行为和打电话行为识别方法在审
申请号: | 202011193873.0 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112257643A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 王景彬;张钦海;黄艳;朱健立;周南南 | 申请(专利权)人: | 天津天地伟业智能安全防范科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 天津企兴智财知识产权代理有限公司 12226 | 代理人: | 李彦彦 |
地址: | 300384 天津市滨海新区高新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 抽烟 行为 打电话 识别 方法 | ||
1.一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:包括以下步骤:
S1:采集模型训练的数据集,从监控设备中获取现场视频数据,然后将获取的数据集进行数据增强处理;
S2:安装编译支持3D卷积的caffe框架;
S3:搭建基于Tiny_darknet-3D深度学习的分类网络架构,将数据集分别送入抽烟分类的3D卷积网络和打电话分类的3D卷积网络;
S4:设置训练网络模型的超参数,利用随机梯度下降算法进行模型的迭代训练;
S5:从待监测场景的监控设备中,直接获取监控视频流,从而获取待检测图像信息;
S6:将步骤S5中获取的视频数据送入步骤S3中预先训练好的模型进行3D卷积处理,并输出分类结果,模型输出的分类结果包括目标所属的类别和对应的置信值;
S7:根据目标的置信值,设置一个阈值,去除置信值较低的目标,排除误检,根据检测出抽烟或打电话的视频流进行随机的图像抓取,然后保存图像。
2.根据权利要求1所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:步骤S1中利用的数据增强处理包括镜像处理、高斯模糊、视频旋转;
数据集中训练集和测试集的样本比例为10∶1。
3.根据权利要求1所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:步骤S1中利用的卷积网络采用Tiny_darknet-3D网络,网络每次输入大小resize为224*224的8帧视频图片,用(c,l,h,w)大小来表示一个视频片段,c表示每一帧图像的channel,l表示视频的帧数,h,w表示视频的图像宽高,(d,k,k)表示卷积核,d表示的就是时间维度的核大小,k表示空间维度的核大小。
4.根据权利要求3所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:卷积网络选取的卷积核为(3,3,3),即将时间维度看成是第三维,3D卷积通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核对8帧图片进行融合卷积,在这个结构中,卷积层中每一个map都会与上一层中多个邻近的连续帧相连,以捕捉物体的运动信息。
5.根据权利要求3所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:训练采用随机裁剪的方式,h和w大小不小于160像素,卷积网络包括15个卷积层、6个池化层、1个全连接层、1个softmax损失函数层。
6.根据权利要求5所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:每次训练采用32个视频片段,即mini_batch=32。
7.根据权利要求1所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:步骤S1中利用的设置训练网络模型的超参数是指设置初始学习率为0.001,每迭代16000次学习率下降0.1,总共降4次,训练的总迭代次数一般设置为每组数据训练4次。
8.根据权利要求1所述的一种基于视频流的抽烟行为和打电话行为识别方法,其特征在于:步骤S3中利用的Tiny_darknet-3D网络的softmaxWithLoss层中loss值的计算方法如下公式所示:
其中,为标签值,k为图像标签对应的神经元,Loss抽烟或打电话为模型损失函数,zi为模型预测类别的概率输出值,m为最大类别概率输出值,即m=max(zi)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津天地伟业智能安全防范科技有限公司,未经天津天地伟业智能安全防范科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011193873.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种单轨行车运输装置
- 下一篇:一种云资源内存利用率准确性优化方法