[发明专利]基于姿态估计的可迁移校园暴力行为视频识别方法有效
申请号: | 201911051259.8 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110826459B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张怡天;姜飞;申瑞民 | 申请(专利权)人: | 上海交通大学;上海信息产业(集团)有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 应小波 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 姿态 估计 迁移 校园 暴力行为 视频 识别 方法 | ||
本发明涉及一种基于姿态估计的可迁移校园暴力行为视频识别方法,该方法包括以下步骤:第一步:数据收集与预处理;第二步:基于姿态估计的可迁移暴力行为判别网络设计;第三步:基于姿态估计的可迁移暴力行为判别网络训练;第四步:用训练好的模型对输入的视频进行校园暴力行为有效识别。与现有技术相比,本发明具有识别精度高等优点。
技术领域
本发明涉及计算机视觉和人工智能领域,尤其是涉及一种基于姿态估计的可迁移校园暴力行为视频识别方法。
背景技术
视频中的暴力行为判断是计算机视觉和人工智能领域的一项重要研究课题。其任务目标可以简要概述为:给定一段连续视频,需要识别其视频中是否出现了暴力行为。暴力判断在智能安防,安全等领域具有重大的现实意义与价值,尤其是对于校园安全来说,暴力行为的判断在一定程度上有助于减少因学生殴打而导致的校园事故。
然而,在校园场景中,由于学生打架样本采集难,数量少,而现有的模型主要基于公开数据集,很难迁移到校园场景中。
现有的暴力视频检测主要分为两类,一种是基于传统检测,第二种是基于机器学习。
第一类的代表方法,从视频中采取血液或爆炸帧作为检测是否存在暴力的线索。但在校园监控视频数据中,原始视频中不太可能有血迹。如果我们想要发现校园里的暴力,应该强调更一般的方法。
第二类的代表方法,使用极端加速度行为作为主要特征,如将Radon变换应用于连续帧。此外,使用HOF提取候选暴力区域并结合SVM,以找到暴力区域。这种基于手工制作功能的方法直观,在小规模数据集中取得了巨大成功,但是当应用于大数据集时,可能会难以训练,因为速度过慢。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种识别精度高的基于姿态估计的可迁移校园暴力行为视频识别方法。
本发明的目的可以通过以下技术方案来实现:
一种基于姿态估计的可迁移校园暴力行为视频识别方法,该方法包括以下步骤:
第一步:数据收集与预处理;
第二步:基于姿态估计的可迁移暴力行为判别网络设计;
第三步:基于姿态估计的可迁移暴力行为判别网络训练;
第四步:用训练好的模型对输入的视频进行校园暴力行为有效识别。
优选地,所述的第一步:数据收集与预处理具体为:
(101)下载公开数据集HockeyFights;
(102)视频下载后,根据视频的名称,将其分开为暴力和非暴力两个文件夹,并将每个视频切分为N帧;
(103)将每张图片缩放至224*224的分辨率大小,以适应后续卷积神经网络的输入需求。
优选地,所述的(102)中的N为40。
优选地,所述的第二步:基于姿态估计的可迁移暴力行为判别网络设计具体为:
(201)选用hourglass网络;
(202)采用OpenPose算法,提取热力图,得到的人物位置信息;
(203)对生成的相邻热力图进行帧差处理,最后输入ConvLSTM网络。
优选地,所述的帧差处理为使用卷积神经网络从热力图中提取分层特征,并使用AlexNet模型作为CNN模型。
优选地,所述的ConvLSTM网络使用相邻帧之间的差异作为输入,ConvLSTM网络模拟相邻帧中的变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海信息产业(集团)有限公司,未经上海交通大学;上海信息产业(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911051259.8/2.html,转载请声明来源钻瓜专利网。