[发明专利]一种基于Transformer的缺陷检测方法及系统在审
申请号: | 202110719488.3 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113610754A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 叶朝伟 | 申请(专利权)人: | 浙江文谷科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/62;G06T3/40;G06N3/04;G06K9/62 |
代理公司: | 宁波甬致专利代理有限公司 33228 | 代理人: | 李迎春 |
地址: | 315194 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 transformer 缺陷 检测 方法 系统 | ||
本发明涉及缺陷检测技术领域,公开了一种基于Transformer的缺陷检测方法及系统,本方法包括步骤:S1:获取待测目标的图像信息,并对待测目标的图像信息进行预设第一处理;S2:将预设第一处理后的待测目标的图像信息通过CNNBackbone进行特征提取,得到待测目标的图像特征信息;S3:将待测目标的图像特征信息输入Transformer结构中进行预设第二处理,并输出N个目标队列。本方法能够通过通过引入DETR(DetectionTransformer)算法来建立联合检测模型,使其既可适用于在小目标上的缺陷检测,也适用于在大目标上的缺陷检测。
技术领域
本发明涉及缺陷检测技术领域,尤其涉及一种基于Transformer的缺陷检测方法及系统。
背景技术
缺陷检测是工业上非常重要的一个应用,由于缺陷多种多样,传统的机器视觉算法很难做到对缺陷特征完整的建模和迁移,复用性不大,要求区分工况,这会浪费大量的人力成本。
深度学习算法用于缺陷检测,一般是按照目标检测路线进行,其中根据检测阶段数分为两类,代表的算法分别为yolo和faster-rcnn,在实践中这两种路线在性能、精度上各有优劣:单阶段检测器如yolo的优点是速度快,准确率和召回率可以满足大多数应用场景,且生态完善,因此yolo算法已经应用于许多工业检测场景;双阶段检测器如faster-rcnn的优点是准确率和召回率高,且有完善的理论工具针对小目标检测,虽然检测速度相比单阶段检测器较慢,但随着硬件性能的提升以及信息整合、主副帧检测等技术的发展,速度上已经能够满足实际检测的需求。但是随着检测任务对要求的提升,faster-rcnn检测器也开始展现出其瓶颈,主要体现在:对于密集小目标的检测性能不稳定,这是由于faster-rcnn系列算法的后处理步骤中需要nms算法(非极大值抑制),使得靠得很紧的密集目标不能完全被识别;另外,由于存在先验框机制,对大目标(如横跨表面的裂纹)的适用性也不强。
发明内容
针对上述现有技术的现状,本发明所要解决的技术问题在于提供一种基于Transformer的缺陷检测方法及系统,通过引入DETR(Detection Transformer)算法来建立联合检测模型,使其既可适用于在小目标上的缺陷检测,也适用于在大目标上的缺陷检测。
本发明一种基于Transformer的缺陷检测方法及系统,具体的包括以下技术方案:
一种基于Transformer的缺陷检测方法,包括步骤:
S1:获取待测目标的图像信息,并对待测目标的图像信息进行预设第一处理;
S2:将预设第一处理后的待测目标的图像信息通过CNN Backbone进行特征提取,得到待测目标的图像特征信息;
S3:将待测目标的图像特征信息输入Transformer结构中进行预设第二处理,并输出N个目标队列;
S4:通过检测前馈网络FNN将Transformer结构输出的目标队列解码成目标框坐标和分类标签,并建立联合检测模型。
具体的,输入信息图像进行预设第一处理,预处理后的图像经过CNN Backbone初步提取特征;提取的特征图输入编码-解码结构的Transformer,输出N个目标队列;Transformer输出的目标队列经过检测前馈网络(FFN),被分别解码成目标框坐标和分类标签。
进一步地,所述预设第一处理包括步骤:
S11:将待测目标的图像信息的图像尺寸处理为预设尺寸范围的标准图像尺寸;
S12:将步骤S11处理后的待测目标的图像信息进行归一化。
进一步地,所述预设尺寸范围为:
待测目标的图像信息中的图像尺寸最大值小于等于1333,待测目标的图像信息中的图像尺寸最小值大于等于800;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江文谷科技有限公司,未经浙江文谷科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110719488.3/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法