[发明专利]基于隐空间的OOD检测方法、装置、服务器及存储介质有效
申请号: | 202110298336.0 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113033817B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 张舒怡;宋丽妍;姚新;武晓宇;胡崝 | 申请(专利权)人: | 南方科技大学;华为技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 ood 检测 方法 装置 服务器 存储 介质 | ||
本发明实施例公开了一种基于隐空间的OOD检测方法、装置、服务器及存储介质,所述方法包括:获取待检测数据;通过预设编码器对待检测数据进行编码处理,以将待检测数据映射至预设编码器的隐藏特征空间,得到压缩特征数据;在隐藏特征空间中,通过多个预设单类别分类器确定压缩特征数据的多个分类结果;若多个分类结果符合预设条件,则确定待检测数据为分布外数据。本发明实施例通过预设编码器和预设单类别分类器的结合实现了OOD数据的检测,预设编码器可以找到表征更精准的特征空间,可以在更低维度空间中进行OOD检测,提高自编码器对OOD数据检测的精度,相比于其他的检测算法可以有效降低内存需求和能耗。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种基于隐空间的OOD检测方法、装置、服务器及存储介质。
背景技术
在机器学习领域,用于训练模型的数据通常被称为分布内(In-distribution,ID)数据,而分布外(Out-of-distribution,OOD)数据是指和训练的ID数据分布不一致的数据。在神经网络模型的实际应用中,输入数据中有时存在OOD数据,这会导致模型预测不准确,进而限制神经网络模块的应用。因此,对机器学习模型的输入数据进行OOD数据检测是提高模型预测准确率的一种重要手段。
现有工作中,自编码器常被用于OOD数据的检测,但其使用方法较为局限。传统的自编码器主要包括编码器和解码器,编码器是一种无监督式学习模型,它利用输入数据本身作为学习目标,来指导编码器学习一个映射关系,强迫神经网络在缩减维度的前提下学习最有信息量的特征,再通过解码器把隐藏层的隐变量还原到初始维度,从而得到一个重构输出数据。当重构输出数据与输入数据误差较大时,即可认为输入数据为OOD数据。然而,自编码器的泛化能力过强,即使是与训练数据不同分布的OOD数据也可能重构得很好,这就导致自编码器无法很好的依赖于重构误差指标检测出OOD数据。
发明内容
有鉴于此,本发明实施例提供一种基于隐空间的OOD检测方法、装置、服务器及存储介质,以提高自编码器对OOD数据检测的精度。
第一方面,本发明实施例提供一种基于隐空间的OOD检测方法,包括:
获取待检测数据;
通过预设编码器对所述待检测数据进行编码处理,以将所述待检测数据映射至所述预设编码器的隐藏特征空间,得到压缩特征数据;
在所述隐藏特征空间中,通过多个预设单类别分类器确定所述压缩特征数据的多个分类结果;
若所述多个分类结果符合预设条件,则确定所述待检测数据为分布外数据。
进一步的,所述通过预设编码器对所述待检测数据进行编码处理,以将所述待检测数据映射至所述预设编码器的隐藏特征空间,得到压缩特征数据之前,还包括:
搭建自编码器模型并设定模型参数;
获取训练样本;
通过所述自编码器模型基于所述模型参数对所述训练样本进行处理,得到模型输出数据;
根据所述训练样本和所述模型输出数据确定样本损失函数;
基于所述样本损失函数更新所述模型参数,返回获取训练样本的步骤,直至所述样本损失函数符合预设条件,得到训练好的自编码器模型,所述训练好的自编码器模型包括预设编码器。
进一步的,所述自编码器模型包括编码器、分类层和解码器,所述训练样本包括原始样本数据和原始样本类标,所述模型输出数据包括重构样本数据和预测样本类标;所述通过所述自编码器模型基于所述模型参数对所述训练样本进行处理,得到模型输出数据包括:
通过所述编码器对所述原始样本数据进行特征提取,得到隐变量;
通过解码器对所述隐变量进行重构,得到重构样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学;华为技术有限公司,未经南方科技大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110298336.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置、电子设备及存储介质
- 下一篇:门板的通用包装容器结构