[发明专利]基于注意力机制残差网络的摄像监控状态分类方法在审

申请号：	201911266108.4	申请日：	2019-12-11
公开（公告）号：	CN111709265A	公开（公告）日：	2020-09-25
发明（设计）人：	裴植;苏彬彬;孔淑萍;蔡志勇	申请（专利权）人：	深学科技（杭州）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	杭州之江专利事务所(普通合伙) 33216	代理人：	林蜀
地址：	310003 浙江省杭州市余杭***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于注意力机制网络摄像监控状态分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

基于注意力机制残差网络的监控状态分类方法，获取监控系统的图像，构建用于训练的数据集；通道注意力模块及空间注意力模块与残差网络的残差模块结合成注意力机制残差模块单元，由多个该单元构建注意力机制残差网络；将数据集输入注意力机制残差网络进行训练，并保存模型；将实时监控图像输入注意力机制残差模块，即可对图像进行故障分类。本发明添加了注意力机制，提高了分类精度，并将模型应用于摄像监控状态的故障检测分类，节约了人工成本。

技术领域

本发明涉及一种计算机图形识别方法，特别涉及一种基于注意力机制残差网络的摄像监控状态分类方法。

背景技术

由于设置不当或器件老化等原因，会导致视频监控系统的视频质量受影响；当对监控的状态进行监测时，出现异常状况时需要能及时报警。

一般监控状态的监测，分为基于图像处理的方法和基于神经网络的方法。基于图像处理的方法需要根据各个故障的特点，对不同的监控状态采取不同的算法进行检测，当监控状态分为较多类时，算法设计难度提升，且不具有较高准确性。卷积神经网络在图像分类中有优秀表现，许多神经网络如Inception系列和ResNet系列的出现，大大提高了图像分类的准确性。神经网络采用端对端的设计，易于植入平台，且可以对多路监控设备进行状态检测并返回分类结果，节省人力的同时保障分类的准确性。

目前，图像分类的研究进展主要集中在前馈卷积神经网络的深度训练上，为了进一步提高深卷积神经网络的识别能力，加深网络的深度，提出了多种方法，如 VGG,Inception,Resnet等，但网络深度的增加，给训练带来了困难，且对硬件要求也越来越高。

注意力机制在人类感知中起着重要的作用，人类视觉系统的一个重要特性是一个人不会试图一次处理整个场景。相反，为了更好地捕捉视觉结构，人类利用一系列的部分瞥见，选择性地聚焦于突出的部分。注意力不仅用于选择一个集中的位置，而且增强了该位置对象的不同表示。

发明内容

为了提高监控状态的分类精度，提供一种基于注意力机制残差网络的监控状态分类方法，这种方法在残差网络ResNet中加入注意力机制，通过堆叠产生注意力感知特征的注意力机制残差模块单元构建网络，随着ResNet层数的深入，来自不同模块单元的感知特征也在不断变化，可以使网络更关注某些特征，增强这些特征的影响，提高了图片处理的效率和准确性。

为实现上述目的，本发明采用以下技术方案：

基于注意力机制残差网络的监控状态分类方法，采用以下步骤：

步骤1：获取监控系统的图像，构建用于训练的数据集，将这些数据集根据故障类型分类，并进行数据集的扩充、标准化的预处理：

步骤1.1：当某个类别的图像数量与所有类别中的最大样本数的比例小于1：4时，对这类图像采取翻转、裁剪、改变亮度的方法扩充样本数，使整个数据集达到平衡；

步骤1.2：将图像缩小为大小，并对缩小后的图像img进行标准化处理，标准化的公式如下：

其中μ为图像img的均值，adjusted_stddev为：

σ为图像img的标准差；

步骤2：通过构建通道注意力模块与空间注意力模块组成注意力机制模块，并与残差网络的残差模块结合产生注意力机制残差模块单元，由多个注意力机制残差模块单元构建注意力机制残差网络：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深学科技（杭州）有限公司，未经深学科技（杭州）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911266108.4/2.html，转载请声明来源钻瓜专利网。