[发明专利]一种标签噪声下基于不确定性评估的结果预测方法在审
申请号: | 202210529489.6 | 申请日: | 2022-05-16 |
公开(公告)号: | CN116051880A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 潘超;袁博;姚新;周维 | 申请(专利权)人: | 南方科技大学;华为技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06V10/30;G06N3/04;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 孙果 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 噪声 基于 不确定性 评估 结果 预测 方法 | ||
本发明公开了一种标签噪声下基于不确定性评估的结果预测方法,方法包括:获取真实场景数据;其中,所述真实场景数据中的部分数据与训练数据分布相异;将真实场景数据输入至已训练的深度神经网络模型和函数模型,得到第一不确定性预测值和初始预测结果,其中,所述深度神经网络模型基于若干次迭代训练得到,每次迭代训练过程中,对训练数据添加权重,并根据权重对训练数据进行筛选;根据所述第一不确定性预测值和所述初始预测结果,得到目标预测结果。本发明实施例通过在训练阶段对训练数据添加权重,并根据权重筛选训练样本,在不影响深度神经网络模型的泛化性的条件下,消除标签噪声对预测不确定性的影响,使得预测结果更加准确。
技术领域
本发明涉及机器学习技术领域,尤其涉及的是一种标签噪声下基于不确定性评估的结果预测方法。
背景技术
在机器学习领域,用于训练模型的数据通常被称为Id-distribution(ID)数据,和训练的ID数据分布不一致的数据被称为Out-of-distribution(OOD)数据。在真实应用场景中,训练数据是有限的,不可能包含所有可能场景,因此OOD数据会出现在实际应用场景中。例如马路上的大象、侧翻的卡车通常不会出现在训练的ID数据中,但在真实场景中是有可能出现的。
近些年以深层神经网络为代表的深度学习已经取得了卓越的成就,在许多领域有广泛的应用。在图片分类、语音识别等任务中,当输入数据是和训练的ID数据独立同分布时,神经网络能够取得卓越的效果,但它们往往无法识别这些预测何时可能是错误的。更严重的是在OOD数据存在的情况下,神经网络模型的预测结果是不可信的。神经网络模型无法为OOD数据提供正确的预测,同时也不会对OOD数据给出较低的预测置信度,反而通常会以很高的置信度将其错误地预测为ID数据的某一种标签。
深度神经网络在给出准确的预测方面表现得很好,但缺乏对给定输出可靠性的认识是在安全关键应用中部署此类模型的一大障碍。在安全性要求较高的领域,比如医疗诊断、自动驾驶等,神经网络模型需要准确地评估对其预测结果的确定程度,即量化预测不确定性。更进一步,神经网络模型需要对预测正确的数据给出高置信度,对预测错误的数据给出低置信度,对无法预测的、和训练数据分布不一致的OOD数据给出低置信度。
近期已经有多种方法被提出来量化深度神经网络中的预测不确定性。这些预测不确定性量化方法可以用于预测结果的误分类检测和OOD数据检测,在训练数据中不存在标签噪声的情况下取得了不错的效果。但在实际应用场景中,训练数据中存在各种标注错误,即使是被广泛使用的数据集,也存在不小比例的标签噪声。而在这种场景下,现有的预测不确定性量化方法都不够鲁棒,即使是很少比例的标签噪声,预测不确定性用于误分类检测和OOD数据检测的效果都会有大幅下降。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种针对标签噪声的不确定性评估,旨在解决现有技术中预测不确定性量化方法都不够鲁棒,即使是很少比例的标签噪声,预测不确定性用于误分类检测和OOD数据检测的效果都会有大幅下降的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种标签噪声下基于不确定性评估的结果预测方法,其中,所述方法包括:
获取真实场景数据;其中,所述真实场景数据中的部分数据与训练数据分布相异;
将真实场景数据输入至已训练的深度神经网络模型和函数模型,得到第一不确定性预测值和初始预测结果,其中,所述深度神经网络模型基于若干次迭代训练得到,每次迭代训练过程中,对训练数据添加权重,并根据权重对训练数据进行筛选;
根据所述第一不确定性预测值和所述初始预测结果,得到目标预测结果。
在一种实现方式中,所述深度神经网络模型的训练过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学;华为技术有限公司,未经南方科技大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210529489.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种咪达唑仑的制备方法及其中间体
- 下一篇:一种数据传输方法和电子设备