[发明专利]基于注意力机制残差网络的摄像监控状态分类方法在审
申请号: | 201911266108.4 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111709265A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 裴植;苏彬彬;孔淑萍;蔡志勇 | 申请(专利权)人: | 深学科技(杭州)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 林蜀 |
地址: | 310003 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 网络 摄像 监控 状态 分类 方法 | ||
1.基于注意力机制残差网络的监控状态分类方法,采用以下步骤:
步骤1:获取监控系统的图像,构建用于训练的数据集,将这些数据集根据故障类型分类,并进行数据集的扩充、标准化的预处理:
步骤1.1:当某个类别的图像数量与所有类别中的最大样本数的比例小于1:4时,对这类图像采取翻转、裁剪、改变亮度的方法扩充样本数,使整个数据集达到平衡;
步骤1.2:将图像缩小为大小,并对缩小后的图像img进行标准化处理,标准化的公式如下:
其中μ为图像img的均值,adjusted_stddev为:
σ为图像img的标准差;
步骤2:通过构建通道注意力模块与空间注意力模块组成注意力机制模块,并与残差网络的残差模块结合产生注意力机制残差模块单元,由多个注意力机制残差模块单元构建注意力机制残差网络:
步骤2.1:构建通道注意力模块:通道注意力模块包括平均池化与最大池化两个池化层、四个全连接层、两个ReLu激活函数、及一个sigmoid激活函数;通道为输入维度的最后一维大小,每个通道为图像的一个特征,通道注意力模块利用各通道间的关系,采用平均池化和最大池化操作聚合特征图的空间信息,生成两个不同的描述特征:平均值池化特征Favg和最大值池化特征Fmax,随后分别输入全连接层并以r倍压缩特征层数,经过激活函数ReLu后恢复原大小输出全连接层,最后结合平均池化和最大池化的特征,并采用sigmoid激活函数输出,得到通道注意力Mc(F),通道特征Fc:
Mc(F)=sigmoid(Favg+Fmax)
步骤2.2:构建空间注意力模块:空间注意力模块包括平均池化与最大池化两个池化层,将两个池化层输出结果级联起来的级联层,一个卷积层,及一个sigmoid函数;空间注意力模块将步骤2.1通道注意力模块的输出通道特征Fc作为输入,在通道上分别做平均值池化与最大值池化,将二者级联形成新的特征层,经过7x7卷积层后采用sigmoid激活函数输出得到空间注意力Ms(F),最后空间特征Fs为:
其中,分别为平均值池化层和最大值池化层,conv为卷积操作;
步骤2.3:组成注意力机制残模块单元:包括残差模块及注意力机制模块,其中残差模块由残差单元bottleneck堆叠而成,bottleneck分为两个分支:残差部分residual和捷径连接shortcut;在residual分支上,输入经过批量标准化BN层和三个卷积层后输入注意力机制模块,注意力机制模块由通道注意力和空间注意力组成,输出与bottleneck的shortcut分支相加,构成整个注意力机制残差模块单元,在卷积层改变卷积核个数构成不同的注意力机制残差模块单元,组成注意力机制残差网络;
步骤3:打乱步骤1中的数据集并将数据集分成多个批次,输入步骤2中的注意力机制残差网络进行训练,并保存模型;
步骤4:将实时监控图像输入注意力机制残差模块,对图像进行故障分类。
[0001]本发明对残差网络ResNet进行了改进,添加了注意力机制,提高了分类精度,并将模型应用于摄像监控状态的故障检测分类,节约了人工成本。
[0002]并且本发明,模型由多个注意力机制残差模块单元组成,随着层次的深入,来自不同模块的注意感知特性也在不断变化,简化了残差网络的训练,同时提高了监控状态分类的精度,提高了效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深学科技(杭州)有限公司,未经深学科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911266108.4/1.html,转载请声明来源钻瓜专利网。