[发明专利]一种基于ST-Unet的视频异常检测方法有效

申请号：	201811501290.2	申请日：	2018-12-10
公开（公告）号：	CN109711280B	公开（公告）日：	2020-10-16
发明（设计）人：	蔡轶珩;李媛媛;刘嘉琦;马杰	申请（专利权）人：	北京工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;H04N7/18
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	刘萍
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 st unet 视频异常检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于ST-Unet的视频异常检测方法，其特征在于，包括以下步骤：

（1）、预处理

将长视频数据切分成单独的视频帧，对切分得到的视频帧图像进行随机的损坏处理，即利用Dropout层随机将图像中的某些值置零；

（2）、构建ST-Unet网络

具体网络搭建步骤如下：

输入层，C1、C2两层卷积层，P1第一次下采样，C3、C4两层卷积层，P2第二次下采样，C5、C6两层卷积层，P3第三次下采样；L1、L2、L3 三层ConvLSTM层；U1第一次上采样，C7、C8两层卷积层，U2第二次上采样，C9、C10两层卷积层，U3第三次上采样，C11、C12两层卷积层，输出层；形成一个前后对称的且加有长短时记忆的U型深度网络构架，ST-Unet；

（3）、利用ST-Unet网络实现基于重构和预测的视频异常检测算法

将预处理后的连续四帧视频帧输入到ST-Unet网络中，分别训练得到重构图像和预测图像；通过最小化输入的视频帧图像与重构图像、预测未来帧图像与真正未来帧图像之间的差值来进行网络优化；并利用对抗模型，将重构图像、预测未来帧图像与对应的ground-truth 同时输入到判别模型中，训练最终目的是使得判别模型无法辨别输入的是重构或预测生成的图像还是原ground-truth；

测试过程：

将测试集中的原始长视频切分成单帧视频帧，然后直接输入到训练好的ST-Unet网络中，分别得到重构图像、预测图像；通过比较输入图像与重构图像得到重构误差；通过比较输入图像与预测图像得到预测误差；对得到的重构误差和预测误差进行加权处理，得到最终的异常分数；通过比较异常分数与所设阈值之间的差异，来判定输入的视频帧是否属于异常。

2.根据权利要求1所述的方法，其特征在于：对得到的重构误差和预测误差进行加权处理，预测异常分数和重构异常分数的加权值均设为 0.5；阈值取0.679。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811501290.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种用于农业环境的障碍物检测方法
下一篇：一种基于深度学习的行人重识别与特征识别融合方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于ST-Unet的视频异常检测方法有效

专利文献下载