[发明专利]一种基于注意力机制的机场X光违禁品图像检测方法在审

申请号：	201910053140.8	申请日：	2019-01-21
公开（公告）号：	CN109800764A	公开（公告）日：	2019-05-24
发明（设计）人：	杨金锋;徐茂书	申请（专利权）人：	中国民航大学
主分类号：	G06K9/40	分类号：	G06K9/40;G06K9/62
代理公司：	天津才智专利商标代理有限公司 12108	代理人：	庞学欣
地址：	300300 天***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	违禁品注意力机制图像检测安检机场图像特征提取图像数据库背景信息目标检测人工标注生成位置训练过程自动检测鲁棒性能力强构建噪声图像监督
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于注意力机制的机场X光违禁品图像检测方法，其特征在于：所述的检测方法包括按顺序进行的下列步骤：

步骤一，采用X光安检机获得原始违禁品图像，然后将原始违禁品图像进行类别标注并进行数据增强处理而获得违禁品图像，由所有违禁品图像构成安检图像数据库；

步骤二，获取CNN预训练模型并修改网络参数，然后利用上述安检图像数据库中的违禁品图像对CNN预训练模型进行微调而获得CNN模型；

步骤三，在上述CNN模型上构建注意力机制模型，并获取违禁品目标注意力图；

步骤四，对上述违禁品目标注意力图中的噪声和背景信息干扰进行抑制，得到抑制后违禁品目标注意力图，以对注意力机制模型进行优化；

步骤五，生成位置窗，利用步骤四获得的抑制后违禁品目标注意力图获取违禁品目标检测图。

2.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法，其特征在于：在步骤一中，所述的将原始违禁品图像进行类别标注并进行数据增强处理的方法是：类别标注是将不同类别的原始违禁品图像放入不同的文件夹，并将文件夹以对应的违禁品类别标注；数据增强处理包括剪切、缩放、平移旋转、高斯加噪以及色彩抖动。

3.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法，其特征在于：在步骤二中，所述的获取CNN预训练模型并修改网络参数，然后利用上述安检图像数据库中的违禁品图像对CNN预训练模型进行微调而获得CNN模型的方法是：首先从Caffe-zoo上下载Googlenet的CNN预训练模型；然后修改CNN预训练模型的网络参数使其适应安检图像数据库，方法是将CNN预训练模型中的决策层由全连接层替换成卷积层，并将原来的1000个输出节点改为八个输出节点以对应八类违禁品；

将步骤一中得到的违禁品图像输入CNN预训练模型而对该模型进行微调，得到CNN模型。

4.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法，其特征在于：在步骤三中，所述的在CNN模型上构建注意力机制模型，并获取违禁品目标注意力图的方法是：构建注意力机制模型是一个反向传导的过程，其在CNN模型各网络层中的具体操作如下：

1)在CNN模型输出层，将CNN模型输出的特征向量归一化，将特征向量中数值最大的元素置为1，其它元素置为0，并将该归一化后的特征向量作为注意力反向传导的输入信号；

2)在卷积层中，将上一层传回的注意力图与该层卷积核的权值进行反卷积运算而得到特征矩阵，若上一层为CNN模型输出层，则将传回的特征向量转换为特征矩阵进行该操作，该特征矩阵与该层输入的尺度相同，并作为注意力图反向传入下一层；

自上而下的注意力计算主要集中在卷积层，其计算原理为：当给定违禁品图像x₀时，CNN模型输出层输出的特征向量S＝f(x₀)即可表示为违禁品图像的语义信息；其中f(x)表示CNN模型的映射函数；而当进行一次前向传导后，CNN模型中的非线性单元——池化层的状态已经确定，因此CNN模型中违禁品图像x₀与特征向量S之间的映射关系可由下式表示：

s＝∑_ijcα_ijc*x_ijc (2)

其中(i,j,c)表示输入空间c通道中坐标为(i,j)的点，α_ijc表示CNN模型中输入层神经元的权重，也可以表示输入违禁品图像中各像素点与输出节点的相关性；x_ijc表示CNN模型中输入层神经元的输出值；为了获取输入层神经元的权重α_ijc，需要进行如下推导：

其中表示CNN模型中第l层神经元的权重，表示CNN模型中第l层神经元的输出值，同时将输入层神经元的权重α_ijc作为违禁品目标注意力图反向传入下一层。

3)在池化层中，在CNN模型进行前向传导时，利用一个index矩阵记录池化层各神经元的激活状态；当上一层的注意力图传回时，利用该层的index矩阵对注意力图进行上采样；上采样后得到的特征矩阵要与该层的输入尺度保持一致并作为注意力图反向传入下一层；

4)在激活层中，由于使用的是ReLU函数，所以当上一层的注意力图传回时，只需进行一次ReLU映射，然后作为注意力图反向传入下一层；

5)在网络输入层中，当注意力图反向传到网络输入层时，此时注意力图的尺度等于违禁品图像的尺度；对注意力图中大于0的点进行筛选，生成违禁品目标注意力图，从而将违禁品目标的类别信息映射到图像空间。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国民航大学，未经中国民航大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910053140.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于深度学习的手写中文识别方法
下一篇：一种海洋输油软管的成型过程质量抽检方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于注意力机制的机场X光违禁品图像检测方法在审

专利文献下载