[发明专利]基于深度学习的图片异常检测方法有效
申请号: | 201911079051.7 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110827265B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 蔡祥睿;丁晓珂;周宝航;张莹;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06V10/82;G06N3/045;G06N3/0455;G06N3/094 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 张颖颢 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图片 异常 检测 方法 | ||
1.一种基于深度学习的图片异常检测方法,该方法利用正常的图片类别数据作为输入数据,构建基于深度学习的图片异常检测模型,所述模型包含两个子模块:一个表示模块,用于学习正常类别的图片数据集的特征,一个检测模块,用于预测输入图片属于异常图片类别的概率,该方法的具体步骤如下:
第1、正常类别图片数据集的预处理
收集正常类别的图片数据集,将正常类别的图片数据集给定标签1;将原始的图片数据集处理成统一的大小和格式,保证接下来的步骤顺利进行;
第2、基于深度学习的图片异常检测模型训练
图片异常检测模型训练包含对表示模块和带有置信度估计的检测模块的训练;通过表示模块学习正常类别的图片数据集的特征,通过检测模块对输入的图片输出异常检测的概率;两模块能够通过对抗式训练获得更好的表现,检测模块增加了置信度估计子模块,能够更准确的输出预测概率;
第2.1、表示模块学习正常类别的图片数据集特征
表示模块由一个对抗自编码器(adversarial autoencoder,AAE)组成,对抗自编码器包含三个子模块:一个编码器,一个解码器和一个编码向量判别器;表示模块接收输入正常类别的图片数据集,通过编码器提取一个编码向量z,并使得解码器能够从编码向量z恢复出原始图像内容;同时由编码器和编码向量判别器组成对抗网络,判别器用来区分输入的编码向量是来自真实的编码向量还是来自预定义的概率分布;整个对抗学习实际通过不断调整让编码器产生的编码向量的概率分布接近预定义的概率分布,让解码器可以通过编码器生成的编码向量尽可能的恢复原始的输入图片;当模型训练完成后,由于编码向量的概率分布接近预定义的概率分布,因此直接通过预定义的概率分布产生随机编码向量,然后借助于解码器产生一个新的图像数据;在这个过程中,整个对抗自编码器学习到了正常类别的图片数据集的特征,并且能够生成一个类似原始输入数据的图片数据;
第2.2、检测模块进行图片异常检测预测
检测模块包含两个子模块:一个图片判别器模块,一个置信度估计模块,图片判别器模块用于区分原始的输入数据和第2.1步中表示模块生成的重构图片,能够输出一个预测概率p;置信度估计模块能够输出一个置信度估计c,表示对于图片判别器输出的预测概率的置信度预测;结合真实的标签yi和置信度估计c来帮助检测模块调整预测概率p得到调整之后的预测概率pi'=c*pi+(1-c)*yi;对于预测概率p,我们希望检测模块对于真实的图片输入预测概率p接近于1,对于重构出来的图片预测概率p接近于0,因此设定损失函数对于置信度估计c,希望检测模块对真实图片和重构出来的图片的预测概率的置信度估计均接近于1,设定损失函数LC=-logc;因此训练的总损失函数为L=LD+λ*LC,其中λ为一个权重系数;使用上述的总损失函数L来使得检测模块不断学习,希望检测模块对原始的输入数据的预测概率和置信度估计都接近1,对第2.1步中表示模块中生成的重构图片的预测概率接近0,置信度估计接近1;经过训练,检测模块区分出原始图片和重构图片的细微特征差别,从而能够很好的分辨出正常类别的图片和异常类别的图片;
第2.3、对抗式的模块训练
将表示模块和检测模块进行对抗式训练,在训练过程中,表示模块为了使得检测模块对生成的重构图片有很高的预测概率,会不断的学习原始图片的特征,从而让生成的重构图片尽可能的与原始图片相近;而检测模块为了区分出原始图片和生成的重构图片,也会不断学习原始图片的特征,尽可能给出很高的置信度估计和差异比较大的预测概率;通过这种对抗性训练,两个模块都会更好的学习到正常类别的图片的特征,为下一步未知类别的图片异常检测做好准备;
第3、未知类别图片异常检测
训练后的检测模块能够对正常类别的图片数据集给出很高的预测概率和置信度估计,而对于异常类别的图片,由于基于深度学习的图片异常检测模型没有学习过异常的图片的特征,因此模型中的检测模块输出的置信度估计比正常类别的图片的置信度估计低;检测模块给出的置信度估计低于0.9的就可以判定输入图片为异常图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911079051.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能路灯
- 下一篇:一种凿岩机器人远程操控视频数据与音频数据同步的方法