[发明专利]一种基于注意力机制的机场X光违禁品图像检测方法在审
申请号: | 201910053140.8 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109800764A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 杨金锋;徐茂书 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06K9/40 | 分类号: | G06K9/40;G06K9/62 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 违禁品 注意力机制 图像检测 安检 机场 图像特征提取 图像数据库 背景信息 目标检测 人工标注 生成位置 训练过程 自动检测 鲁棒性 能力强 构建 噪声 图像 监督 | ||
1.一种基于注意力机制的机场X光违禁品图像检测方法,其特征在于:所述的检测方法包括按顺序进行的下列步骤:
步骤一,采用X光安检机获得原始违禁品图像,然后将原始违禁品图像进行类别标注并进行数据增强处理而获得违禁品图像,由所有违禁品图像构成安检图像数据库;
步骤二,获取CNN预训练模型并修改网络参数,然后利用上述安检图像数据库中的违禁品图像对CNN预训练模型进行微调而获得CNN模型;
步骤三,在上述CNN模型上构建注意力机制模型,并获取违禁品目标注意力图;
步骤四,对上述违禁品目标注意力图中的噪声和背景信息干扰进行抑制,得到抑制后违禁品目标注意力图,以对注意力机制模型进行优化;
步骤五,生成位置窗,利用步骤四获得的抑制后违禁品目标注意力图获取违禁品目标检测图。
2.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法,其特征在于:在步骤一中,所述的将原始违禁品图像进行类别标注并进行数据增强处理的方法是:类别标注是将不同类别的原始违禁品图像放入不同的文件夹,并将文件夹以对应的违禁品类别标注;数据增强处理包括剪切、缩放、平移旋转、高斯加噪以及色彩抖动。
3.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法,其特征在于:在步骤二中,所述的获取CNN预训练模型并修改网络参数,然后利用上述安检图像数据库中的违禁品图像对CNN预训练模型进行微调而获得CNN模型的方法是:首先从Caffe-zoo上下载Googlenet的CNN预训练模型;然后修改CNN预训练模型的网络参数使其适应安检图像数据库,方法是将CNN预训练模型中的决策层由全连接层替换成卷积层,并将原来的1000个输出节点改为八个输出节点以对应八类违禁品;
将步骤一中得到的违禁品图像输入CNN预训练模型而对该模型进行微调,得到CNN模型。
4.根据权利要求1所述的基于注意力机制的机场X光违禁品图像检测方法,其特征在于:在步骤三中,所述的在CNN模型上构建注意力机制模型,并获取违禁品目标注意力图的方法是:构建注意力机制模型是一个反向传导的过程,其在CNN模型各网络层中的具体操作如下:
1)在CNN模型输出层,将CNN模型输出的特征向量归一化,将特征向量中数值最大的元素置为1,其它元素置为0,并将该归一化后的特征向量作为注意力反向传导的输入信号;
2)在卷积层中,将上一层传回的注意力图与该层卷积核的权值进行反卷积运算而得到特征矩阵,若上一层为CNN模型输出层,则将传回的特征向量转换为特征矩阵进行该操作,该特征矩阵与该层输入的尺度相同,并作为注意力图反向传入下一层;
自上而下的注意力计算主要集中在卷积层,其计算原理为:当给定违禁品图像x0时,CNN模型输出层输出的特征向量S=f(x0)即可表示为违禁品图像的语义信息;其中f(x)表示CNN模型的映射函数;而当进行一次前向传导后,CNN模型中的非线性单元——池化层的状态已经确定,因此CNN模型中违禁品图像x0与特征向量S之间的映射关系可由下式表示:
s=∑ijcαijc*xijc (2)
其中(i,j,c)表示输入空间c通道中坐标为(i,j)的点,αijc表示CNN模型中输入层神经元的权重,也可以表示输入违禁品图像中各像素点与输出节点的相关性;xijc表示CNN模型中输入层神经元的输出值;为了获取输入层神经元的权重αijc,需要进行如下推导:
其中表示CNN模型中第l层神经元的权重,表示CNN模型中第l层神经元的输出值,同时将输入层神经元的权重αijc作为违禁品目标注意力图反向传入下一层。
3)在池化层中,在CNN模型进行前向传导时,利用一个index矩阵记录池化层各神经元的激活状态;当上一层的注意力图传回时,利用该层的index矩阵对注意力图进行上采样;上采样后得到的特征矩阵要与该层的输入尺度保持一致并作为注意力图反向传入下一层;
4)在激活层中,由于使用的是ReLU函数,所以当上一层的注意力图传回时,只需进行一次ReLU映射,然后作为注意力图反向传入下一层;
5)在网络输入层中,当注意力图反向传到网络输入层时,此时注意力图的尺度等于违禁品图像的尺度;对注意力图中大于0的点进行筛选,生成违禁品目标注意力图,从而将违禁品目标的类别信息映射到图像空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910053140.8/1.html,转载请声明来源钻瓜专利网。