[发明专利]一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法在审
申请号: | 202310245658.8 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116468667A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 许彩娥;李俊;干劲;王炳炎;吴明洋 | 申请(专利权)人: | 浙江科技学院;浙江振亚控股集团有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464;G06N3/0455;G06N3/096;G06N3/088 |
代理公司: | 杭州航璞专利代理有限公司 33498 | 代理人: | 周方建 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加入 transformer 知识 蒸馏 监督 缺陷 检测 方法 | ||
1.一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:包含教师模型、学生模型结构、串式知识蒸馏结构、串式知识蒸馏训练方式;具体包含如下步骤:
步骤1,在教师模型与学生模型结构之间加入基于Transformer的特征聚合过滤模块;
步骤2,将正常的样本加入模型进行进行压缩并重构训练;
步骤3,将训练好的网络在测试集上进行重构对重构结果进行对比实现像素级缺陷检测。
2.根据权利要求1所述的一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:在步骤1中,基于Transformer的特征聚合过滤模块,是由一个多尺度特征融合模块、一个基于transformer的VIT模块和一个残差模块组成。
3.根据权利要求1所述的一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:在步骤1中,基于Transformer的特征聚合过滤模块,使用CNN-transformer混合模型,具体如下:
步骤1.1,使用CNN卷积作为多尺度特征融合来生成输入的特征映射;
步骤1.2,补丁嵌入应用于从CNN特征图中提取的1个1×1个补丁;
步骤1.3,在通过CNN-transformer特征聚合之后,将特征图通过残差模块进行过滤,以避免数据偏差引起的噪声。
4.根据权利要求1所述的一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:所述步骤2具体如下:
步骤2.1,获取正常样本图像数据;
步骤2.2,对图像进行数据增强;
步骤2.3,将图像放入教师网络进行多尺度特征提取;
步骤2.4,讲多尺度特征放聚合过滤模块进行特征压缩;
步骤2.5,压缩后的特征通过学生网络进行重构多尺度特征;
步骤2.6,对比多尺度特征与重构多尺度特征更新聚合过滤模块、学生网络参数;
步骤2.7,完成预定轮次训练。
5.根据权利要求4所述的一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:在步骤2中,由于是对各层特征张量进行差异对比,Teacher-Student模型中每一层的特征张量可表示为
其中,Ei和Di分别表示Teacher-Student模型中的第i层特征提取层和特征重构层,F和Fbn分别代表来自上一层的传入结果;
针对Ci、Hi、Wi分别代表第i层激活层的通道数、高度和宽度,计算沿着通道轴方向的向量余弦相似度损失,得到一个异常特征图feature map:
计算Student模型和Teacher模型对应层的输出特征间的余弦相似度,以此来作为Student模型和Teacher模型之间的损失差异;损失函数的计算公式,具体如下
其中,I代表模型中编码器和解码器的层数;它代表着Teacher模型某一层编码器和Student模型对应层解码器的输出特征间的差异要尽可能小。
6.根据权利要求1所述的一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,其特征在于:在步骤3中,
选择特征张量之间的异常feature map来作为该指标的计算方式,同时,考虑到三对编码器和解码器的尺度是不同的,对三对编码器和解码器进行双线性上采样至图像尺度,再将这几部分的feature map相加,来作为像素级别的异常分数,公式具体如下所示,
对于异常检测的评价中,采用感受性曲线下方面积AUROC作为评价度量;
对于图像级异常检测,测试图像级感受性曲线下方面积AUROC进行检测;
对于异常定位,测试每颗像素测量的感受性曲线下方面积AUROC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院;浙江振亚控股集团有限公司,未经浙江科技学院;浙江振亚控股集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310245658.8/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法