[发明专利]一种基于ST-Unet的视频异常检测方法有效
申请号: | 201811501290.2 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109711280B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 蔡轶珩;李媛媛;刘嘉琦;马杰 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;H04N7/18 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 st unet 视频 异常 检测 方法 | ||
基于ST‑Unet网络的视频异常检测方法,涉及计算机视觉以及模式识别领域。本发明针对视频这类具有强时空相关性数据的处理问题提出新的ST‑Unet网络,该网络即利用了Unet网络在空间特征上良好的建模能力又结合了ConvLSTM在时间上的建模能力。为提高算法的准确性及其泛华能力,本发明在算法训练过中对输入的视频数据利用Dropout层进行“损坏”预处理。通过“损坏”的训练数据训练得到的网络不仅可以对完好的测试数据有较好的异常检测效果,对测试过程含噪的数据亦可检测出是否异常。本发明将重构算法结果与预测算法结果进行联合判别,实现了高精度的基于ST‑Unet网络的视频异常检测算法。
技术领域
本发明属于计算机视觉和模式识别领域,涉及一种ST-Unet网络的视频异常检测方法。
背景技术
随着社会的不断进步,平安城市的概念逐步成为人们最为关注的话题之一。其中,完善的监控系统是建设平安城市非常重要的一环,视频监控技术成为目前最重要的安防监控的手段和方法。目前,普遍的监控视频处理方法都还是较为初级的监控方式,即利用监控摄像头拍摄画面并提供实时显示,由监管人员实时观察监控视频,根据经验来判断是否有异常事件发生。这种监控方式不仅需要管理人员对监控视频画面时刻观察,耗费大量劳动力,且专人观察易疲劳,注意力不可能长时间集中在监控视频上,易出现漏检现象。因此,智能的高精度的视频异常检测系统成为监控管理的迫切需求。视频异常检测系统可以实时检测监控画面,当异常出现时给予管理人员警示,这不仅减少人力资源的投入,还使得实时处理所有拍摄摄像头传回的大量的视频数据成为可能,更好的维护社会治安,建设平安城市。
由于日常监控视频数据中大多为正常事件,异常事件很少发生且异常事件类型多种多样、难以预测,故现有的异常检测算法均基于非监督和半监督的方法,且非监督的异常检测算法种大多基于自编码器的结构。针对视频数据强时空相关性的特点,部分算法又在自编码器中加入LSTM结构来增强算法在时间上的建模能力,但这种提取特征后再进行时间上建模的方法仍忽略了许多时候视频数据的时空特征。
发明内容
针对现有算法的不足,本发明提出一个高精度的基于ST-Unet网络的视频异常检测算法。在Unet网络中加入ConvLSTM结构,即利用了Unet网络对输入数据多尺度建模的特点,又加入ConvLSTM加强对输入数据时间上的建模。相较于现有算法,本发明提出的ST-Unet网络对视频类具有强时空相关性的数据有很好的建模作用,在视频异常检测问题方面有较高的准确率。
本发明提供一种高精度基于ST-Unet网络的视频异常检测算法,包括以下步骤:
1、预处理
首先,将原始的长视频数据切分成单帧的视频帧图像。其次,对切分好的视频帧利用Dropout层进行“损坏”处理,即随意使输入的视频帧的某些值置零。
2、构造ST-Unet网络
本发明所构建的网络结构为:
输入层,两层卷积层(C1、C2),第一次下采样(P1),两层卷积层(C3、C4),第二次下采样(P2),两层卷积层(C5、C6),第三次下采样(P3);三层ConvLSTM层(L1、L2、L3);第一次上采样(U1),两层卷积层(C6、C7),第二次上采样(U2),两层卷积层(C8、C9),第三次上采样(U3),两层卷积层(C10、C11),输出层。形成一个前后对称的且加有长短时记忆的U型深度网络构架,ST-Unet。
3、利用ST-Unet网络实现基于重构和预测的视频异常检测算法
训练过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811501290.2/2.html,转载请声明来源钻瓜专利网。