[发明专利]一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法在审
申请号: | 202310245658.8 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116468667A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 许彩娥;李俊;干劲;王炳炎;吴明洋 | 申请(专利权)人: | 浙江科技学院;浙江振亚控股集团有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464;G06N3/0455;G06N3/096;G06N3/088 |
代理公司: | 杭州航璞专利代理有限公司 33498 | 代理人: | 周方建 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加入 transformer 知识 蒸馏 监督 缺陷 检测 方法 | ||
本发明公开了本发明公开一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,属于无监督缺陷检测技术领域,包含教师模型、学生模型结构、串式知识蒸馏结构、串式知识蒸馏训练方式;包括:教师模型,学生模型结构;串式知识蒸馏训练方式;在教师模型与学生模型之间加入基于Transformer的特征聚合过滤模块。将正常的样本加入模型进行进行压缩并重构训练,将训练好的网络在测试集上进行重构对重构结果进行对比实现像素级缺陷检测。本发明在无监督缺陷检测上实现了优秀的性能。
技术领域
本发明涉及无监督缺陷检测技术领域,一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法。
背景技术
缺陷检测是计算机视觉的一个重要的研究问题,其目的是从数据集中检测出与正常数据有差异的各类异常缺陷。根据应用场景不同,包括制造缺陷检测、医学图像分析和视频监控。传统异常检测方法:基于模板匹配、基于统计模型、基于图像分解等,但是由于传统方法的泛化能力和检测效果均不理想。因此主流的异常检测算法通常基于深度学习技术,按照使用的监督信息可以分为有监督方法、无监督方法、半监督方法。
有监督的方法需要收集大量的正常样本和缺陷样本并进行标注。实际中,缺陷样本往往是很稀缺的,通常难以收集足够数量的异常样本来训练模型,其次对缺陷样本进行界定及标注也会消耗大量的人工成本。因此无监督异常检测成为近年来的主要发展方向。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,在仅使用正常样本且无标注的情况下,实现了对测试样本进行缺陷检测和像素级缺陷定位,且实现了优秀的检测性能。
本发明为解决上述技术问题采用以下技术方案:
一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法,包含教师模型、学生模型结构、串式知识蒸馏结构、串式知识蒸馏训练方式;具体包含如下步骤:
步骤1,在教师模型与学生模型结构之间加入基于Transformer的特征聚合过滤模块;
步骤2,将正常的样本加入模型进行进行压缩并重构训练;
步骤3,将训练好的网络在测试集上进行重构对重构结果进行对比实现像素级缺陷检测。
作为本发明一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法的进一步优选方案,在步骤1中,基于Transformer的特征聚合过滤模块,是由一个多尺度特征融合模块、一个基于transformer的VIT模块和一个残差模块组成。
作为本发明一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法的进一步优选方案,在步骤1中,基于Transformer的特征聚合过滤模块,使用CNN-transformer混合模型,具体如下:
步骤1.1,使用CNN卷积作为多尺度特征融合来生成输入的特征映射;
步骤1.2,补丁嵌入应用于从CNN特征图中提取的1个1×1个补丁;
步骤1.3,在通过CNN-transformer特征聚合之后,将特征图通过残差模块进行过滤,以避免数据偏差引起的噪声。
作为本发明一种加入Transformer的串式知识蒸馏的无监督缺陷检测方法的进一步优选方案,所述步骤2具体如下:
步骤2.1,获取正常样本图像数据;
步骤2.2,对图像进行数据增强;
步骤2.3,将图像放入教师网络进行多尺度特征提取;
步骤2.4,讲多尺度特征放聚合过滤模块进行特征压缩;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院;浙江振亚控股集团有限公司,未经浙江科技学院;浙江振亚控股集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310245658.8/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法