[发明专利]一种基于数据增强的分布外异常样本检测方法在审
申请号: | 202110635014.0 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113392890A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 王崇骏;姜文玉;杜云涛;朱志威;李宁 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 孙建朋 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 增强 分布 异常 样本 检测 方法 | ||
本发明提出了一种基于数据增强的分布外异常样本检测方法。特征提取阶段,使用自动编码器算法的编码器部分,提取输入分布内样本的特征向量;数据增强和重建阶段,使用基于特征的数据增强方法对特征提取阶段提取到的特征进行变换,并使用自动编码器的解码器部分,从增强后的特征向量中生成数量充足且包含语义信息的辅助分布外异常样本数据集;样本标记阶段,将原始分类器对重建样本的预测准确度作为分布外异常样本的软标签值;分类器重训练阶段,联合包含硬标签监督信号的分布内训练数据集及包含软标签监督信号辅助分布外异常样本数据集,重新训练分类器;本发明改善了深度神经网络模型在预测分布外异常样本时的不确定性,提升了模型的安全性。
技术领域
本发明属于可信机器学习领域,尤其涉及一种基于数据增强的分布外异常样本检测方法。
背景技术
当机器学习分类器被应用于真实世界的任务中时,它们往往会失败当训练和测试数据集分布不同的时候。更糟糕的是,这些分类器经常安静地失败同时提供高度自信的预测,不幸地是,这些预测是不正确的。如果分类器不能指出它们可能出错的时间,就会限制它们的使用,甚至会导致严重的事故。例如,一个医学疾病诊断模型可能会始终如一地进行高度自信的分类,即使它应该标记出需要人工干预的困难样例。由此产生的未标记的错误诊断可能会阻碍机器学习技术在医学领域的未来发展。更普遍且重要的是,估计模型何时犯错对于人工智能安全而言是个至关重要的问题。
这些过度自信的预测经常产生自softmax层因为softmax层概率使用快速增长的指数函数计算。因此,对于softmax层输入微小的增加会带来输出分布上的巨大改变。因为softmax函数是指示函数的平滑近似,因此对于分布外样本而言很难看到一个均匀分布输出。
发明内容
本发明目的在于提供一种基于数据增强的分布外异常样本检测方法,以解决模型预测的不确定性和模型安全性低的技术问题。
为解决上述技术问题,本发明的具体技术方案如下:
一种基于数据增强的分布外异常样本检测方法,包括以下步骤:
步骤1、特征提取,使用自动编码器算法,提取输入分布内样本的特征向量;
步骤2、数据增强和重建,使用基于特征的数据增强方法对特征提取阶段提取到的特征进行变换,接着使用自动编码器的解码部分从增强后的特征向量中生成数量充足且包含语义信息的辅助分布外异常样本数据集,其中数量充足指的是特征向量所对应的软标签信息在输出空间分布均匀;
步骤3、样本标记,将原始分类器对重建样本的预测准确度作为分布外异常样本软标签值;
步骤4、分类器重训练,联合包含硬标签监督信号的分布内训练数据集及包含软标签监督信号的分布外异常样本数据集,重新训练分类器。
进一步的,步骤1包括以下步骤:
步骤1.1、将输入样本通过编码器映射到特征空间,得到抽象特征;
步骤1.2、将抽象特征映射回原始空间得到重构样本;
步骤1.3、通过最小化重构误差来同时优化编码器和解码器,得到最优的模型参数;
步骤1.4、输出针对样本输入的抽象特征表示。
进一步的,步骤2包括以下步骤:
步骤2.1、将样本的抽象特征表示对应到特征空间中的某点,按照欧氏距离找出该点的K个最近邻样本;
步骤2.2、对这K个样本和原始样本在特征空间进行线性插值,得到新样本的抽象特征表示;
步骤2.3、重复以上步骤,直到生成充足数量的抽象特征表示;
步骤2.4、根据增强后的抽象特征,利用原始抽象特征对应的自动编码器的解码器部分进行样本重建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110635014.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置