[发明专利]基于元学习的神经网络训练方法及神经网络在审
申请号: | 202110288472.1 | 申请日: | 2021-03-18 |
公开(公告)号: | CN115115015A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 李皓翔;刘博;康昊;华刚 | 申请(专利权)人: | 虫极科技(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06K9/62 |
代理公司: | 北京律和信知识产权代理事务所(普通合伙) 11446 | 代理人: | 郝文博 |
地址: | 100015 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 神经网络 训练 方法 | ||
本发明提供了基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。该方法包括:提供元模型神经网络;利用少样本训练数据集,通过元学习算法,对所述元模型神经网络进行训练,以得到经过少样本训练的元模型神经网络参数,其中所述少样本训练数据集仅包括已知类别的少样本训练数据;以及利用测试数据集,通过开放集识别方法,对经过训练的元模型神经网络进行优化,其中所述测试数据集既包括已知类别的测试数据,还包括未知类别的测试数据。
技术领域
本申请涉及人工智能领域,具体涉及基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。
背景技术
少样本学习是实际应用机器学习算法时会遇到的问题。少样本学习主要解决当某一类别图像在训练时标注数据很少的情况下,如何训练模型区分出这一类图像的问题。针对少样本学习,现有的常用方法包括原型网络、关系网络和匹配网络。
开放集识别也是实际应用机器学习算法时会遇到的问题。开放集识别主要解决在模型部署时,遇到不在训练类别的输入时,如何区分出来这些图像的问题。针对开放集识别,现有的常用方法包括OpenMax和Counterfactual。
目前,现有技术中还没有技术方案能够在一个统一框架下解决这两个问题。也就是说,现有技术没有直接针对少样本和开放集两类设定同时出现的场景。由于之前针对少样本学习的方法无法处理开放集识别的问题,所以只能混合使用现有的少样本学习和开放集识别的方法处理这种新的场景。训练得到的模型在分类精度,以及开放集样本检测这两个指标上表现都不高。
发明内容
基于此,本发明提供了一种基于元学习的神经网络训练方法,其包括:
S101:提供元模型神经网络;
S102:利用少样本训练数据集,通过元学习算法,对所述元模型神经网络进行训练,以得到经过少样本训练的元模型神经网络参数,其中所述少样本训练数据集仅包括已知类别的少样本训练数据;以及
S103:利用测试数据集,通过开放集识别方法,对经过训练的元模型神经网络进行优化,其中所述测试数据集既包括已知类别的测试数据,还包括未知类别的测试数据。
根据一个实施方式,该方法还包括:
重复执行步骤S102和S103,以得到多次迭代训练优化的元模型神经网络。
根据一个实施方式,步骤S103包括:
将所述测试数据集中的测试数据输入经过训练的元模型神经网络,以得到所述测试数据的分类结果;
根据分类结果,计算所述测试数据的损失函数;以及
基于所述损失函数,对所述元模型神经网络的参数进行优化。
根据一个实施方式,根据分类结果,计算所述测试数据的损失函数包括:
计算所述已知类别的测试数据在所述已知类别上的交叉熵作为第一损失函数;以及
计算所述未知类别的测试数据在所述已知类别上的交叉熵作为第二损失函数。
根据一个实施方式,基于所述损失函数,对所述元模型神经网络的参数进行优化包括:
以使所述第一损失函数最小化为条件,按照所述第一损失函数对应的梯度更新所述元模型神经网络的参数;以及
以使所述第二损失函数最大化为条件,按照所述第二损失函数对应的梯度更新所述元模型神经网络的参数。
根据一个实施方式,该方法还包括:
将每个已知类别的训练数据和测试数据在特征空间中的分布形状预设为椭球形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于虫极科技(北京)有限公司,未经虫极科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110288472.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高氧钢连铸用长水口
- 下一篇:一种中空纤维气体分离膜组件缺陷消除方法