[发明专利]基于姿态估计的可迁移校园暴力行为视频识别方法有效
申请号: | 201911051259.8 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110826459B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张怡天;姜飞;申瑞民 | 申请(专利权)人: | 上海交通大学;上海信息产业(集团)有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 应小波 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 姿态 估计 迁移 校园 暴力行为 视频 识别 方法 | ||
1.一种基于姿态估计的可迁移校园暴力行为视频识别方法,其特征在于,该方法包括以下步骤:
第一步:数据收集与预处理;
第二步:基于姿态估计的可迁移暴力行为判别网络设计;
第三步:基于姿态估计的可迁移暴力行为判别网络训练;
第四步:用训练好的模型对输入的视频进行校园暴力行为有效识别;
所述的第二步:基于姿态估计的可迁移暴力行为判别网络设计具体为:
(201)选用hourglass网络;
(202)采用OpenPose算法,提取热力图,得到的人物位置信息;
(203)对生成的相邻热力图进行帧差处理,最后输入ConvLSTM网络;
所述的帧差处理为使用卷积神经网络从热力图中提取分层特征,并使用AlexNet模型作为CNN模型;
所述的ConvLSTM网络使用相邻帧之间的差异作为输入,ConvLSTM网络模拟相邻帧中的变化;
所述的ConvLSTM网络在LSTM的基础上,将W的权值计算改变成了卷积运算。
2.根据权利要求1所述的一种基于姿态估计的可迁移校园暴力行为视频识别方法,其特征在于,所述的第一步:数据收集与预处理具体为:
(101)下载公开数据集HockeyFights;
(102)视频下载后,根据视频的名称,将其分开为暴力和非暴力两个文件夹,并将每个视频切分为N帧;
(103)将每张图片缩放至224*224的分辨率大小,以适应后续卷积神经网络的输入需求。
3.根据权利要求2所述的一种基于姿态估计的可迁移校园暴力行为视频识别方法,其特征在于,所述的(102)中的N为40。
4.根据权利要求1所述的一种基于姿态估计的可迁移校园暴力行为视频识别方法,其特征在于,所述的第三步:基于姿态估计的可迁移暴力行为判别网络训练具体为:
(301)从第一步中下载的HockeyFights数据,采集一批样本;
(302)将步骤301采集的一批样本送入设计的网络;
(303)首先OpenPose处理后生成热力图,然后对相邻两个热力图相减,将相减的图,送入CNN模型和ConvLSTM网络,进行前向传播,根据全连接层的分类结果和样本的标签计算交叉熵损失值;
(304)根据得到的交叉熵损失值对网络进行反向传播;
(305)根据反向传播计算出的梯度对网络执行梯度下降算法并更新参数,不断重复步骤(301)至(304),直至网络收敛。
5.根据权利要求1所述的一种基于姿态估计的可迁移校园暴力行为视频识别方法,其特征在于,所述的第四步:用训练好的模型对输入的视频进行校园暴力行为有效识别巨头为:
(401)将测试视频切帧成40帧数,一个视频为一批;
(402)加载训练好的模型,并把步骤(401)的一批样本导入网络;
(403)然后模型会返回1,0两个值,1代表有打架发生,0代表无打架发生;在场景人数小于设定阈值时,根据openpose提供的人体姿态信息,标注出打架的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海信息产业(集团)有限公司,未经上海交通大学;上海信息产业(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911051259.8/1.html,转载请声明来源钻瓜专利网。