[发明专利]一种基于深度学习的X光安检图像中非金属打火机检测方法在审
申请号: | 202110958470.9 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113822265A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 黄志清;张煜森 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06N3/04;G06N3/08;G06T3/00;G06T3/60;G06T7/11 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 安检 图像 中非 金属 打火机 检测 方法 | ||
1.一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:该方法分为两步,
(1)数据增强与多尺度训练:模型训练所用数据,来自机场安检口、地铁安检口真实场景下采集的X光安检图像,共计896张图像,并且对该896张图像组成的数据集进行数据增强,使用3种不同的数据增强方法,并且以mix-up的方式融合数据增强数据,提升对于非金属打火机的定位能力;为提升模型对于任意尺度的X光安检图像具有较好的识别能力,在训练时使用多尺度训练方式,每10次迭代将图像输入大小调整为320至608之间的任意的32的倍数大小;
(2)端到端模型:应用X光安检图像非金属打火机识别模型,将真实场景下的X光安检图像输入的模型,模型的直接输出非金属打火机检出结果。
2.根据权利要求1所述的一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:所述的数据集包括单包裹图像以及复杂的多包裹图像,使用Labelimg对该数据集图像按照PASCALVOC格式进行标注,为扩充数据集提升模型泛化性能,使用随机裁剪、随机旋转、随机仿射变换三种数据增强方式,将这些数据以Mix-Up方式进行融合,有效扩充数据集使增强模型对于非金属打火机定位。
3.根据权利要求1所述的一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:非金属打火机识别模型的流程为:将任意大小的X光安检图像输入卷积神经网络,经过一系列卷积操作,提取非金属打火机特征,之后对特征向量进行回归与分类,输出非金属打火机坐标以及类别信息。
4.根据权利要求1所述的一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:非金属打火机识别模型分为2个部分,非金属打火机特征提取网络部分,以及多尺度特征融合与模型检测部分;非金属打火机特征提取网络部分,使用YOLOv4中的CSPdarknet53网络,其网络结构,特征提取网络含有五个跨阶段局部网络,每个局部网络中分别还有1,2,8,8,4个残差模块;多尺度特征融合与模型检测部分采用改进型通道注意力模块加强特征提取网络,对于非金属打火机有效特征的提取,使用全局最大池化与全局平均池化共同反应通道的响应情况。
5.根据权利要求1所述的一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:在特征提取网络中对特征图进行五次下采样,设计Do-PAN特征融合模块,使用Do-Conv替换普通卷积,将浅层特征与深层特征融合,进一步提升模型对于非金属打火机小目标的识别准确率。
6.根据权利要求1所述的一种基于深度学习的X光安检图像中非金属打火机检测方法,其特征在于:模型的三种输出特征图上,每个像素点预测一个3*(4+1+1)维的向量,其中3表示如果目标中心位于该像素点,该像素点将预测3种边界框,4表示坐标向量,1表示置信度向量和类别概率向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110958470.9/1.html,转载请声明来源钻瓜专利网。