[发明专利]基于元学习的神经网络训练方法及神经网络在审

申请号：	202110288472.1	申请日：	2021-03-18
公开（公告）号：	CN115115015A	公开（公告）日：	2022-09-27
发明（设计）人：	李皓翔;刘博;康昊;华刚	申请（专利权）人：	虫极科技（北京）有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06N20/00;G06K9/62
代理公司：	北京律和信知识产权代理事务所(普通合伙) 11446	代理人：	郝文博
地址：	100015 北京市朝阳***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于学习神经网络训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。该方法包括：提供元模型神经网络；利用少样本训练数据集，通过元学习算法，对所述元模型神经网络进行训练，以得到经过少样本训练的元模型神经网络参数，其中所述少样本训练数据集仅包括已知类别的少样本训练数据；以及利用测试数据集，通过开放集识别方法，对经过训练的元模型神经网络进行优化，其中所述测试数据集既包括已知类别的测试数据，还包括未知类别的测试数据。

技术领域

本申请涉及人工智能领域，具体涉及基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。

背景技术

少样本学习是实际应用机器学习算法时会遇到的问题。少样本学习主要解决当某一类别图像在训练时标注数据很少的情况下，如何训练模型区分出这一类图像的问题。针对少样本学习，现有的常用方法包括原型网络、关系网络和匹配网络。

开放集识别也是实际应用机器学习算法时会遇到的问题。开放集识别主要解决在模型部署时，遇到不在训练类别的输入时，如何区分出来这些图像的问题。针对开放集识别，现有的常用方法包括OpenMax和Counterfactual。

目前，现有技术中还没有技术方案能够在一个统一框架下解决这两个问题。也就是说，现有技术没有直接针对少样本和开放集两类设定同时出现的场景。由于之前针对少样本学习的方法无法处理开放集识别的问题，所以只能混合使用现有的少样本学习和开放集识别的方法处理这种新的场景。训练得到的模型在分类精度，以及开放集样本检测这两个指标上表现都不高。

发明内容

基于此，本发明提供了一种基于元学习的神经网络训练方法，其包括：

S101：提供元模型神经网络；

S102：利用少样本训练数据集，通过元学习算法，对所述元模型神经网络进行训练，以得到经过少样本训练的元模型神经网络参数，其中所述少样本训练数据集仅包括已知类别的少样本训练数据；以及

S103：利用测试数据集，通过开放集识别方法，对经过训练的元模型神经网络进行优化，其中所述测试数据集既包括已知类别的测试数据，还包括未知类别的测试数据。

根据一个实施方式，该方法还包括：

重复执行步骤S102和S103，以得到多次迭代训练优化的元模型神经网络。

根据一个实施方式，步骤S103包括：

将所述测试数据集中的测试数据输入经过训练的元模型神经网络，以得到所述测试数据的分类结果；

根据分类结果，计算所述测试数据的损失函数；以及

基于所述损失函数，对所述元模型神经网络的参数进行优化。

根据一个实施方式，根据分类结果，计算所述测试数据的损失函数包括：