[发明专利]基于元学习的神经网络训练方法及神经网络在审
申请号: | 202110288472.1 | 申请日: | 2021-03-18 |
公开(公告)号: | CN115115015A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 李皓翔;刘博;康昊;华刚 | 申请(专利权)人: | 虫极科技(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06K9/62 |
代理公司: | 北京律和信知识产权代理事务所(普通合伙) 11446 | 代理人: | 郝文博 |
地址: | 100015 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 神经网络 训练 方法 | ||
1.一种基于元学习的神经网络训练方法,包括:
S101:提供元模型神经网络;
S102:利用少样本训练数据集,通过元学习算法,对所述元模型神经网络进行训练,以得到经过少样本训练的元模型神经网络参数,其中所述少样本训练数据集仅包括已知类别的少样本训练数据;以及
S103:利用测试数据集,通过开放集识别方法,对经过训练的元模型神经网络进行优化,其中所述测试数据集既包括已知类别的测试数据,还包括未知类别的测试数据。
2.如权利要求1所述的神经网络训练方法,还包括:
重复执行步骤S102和S103,以得到多次迭代训练优化的元模型神经网络。
3.如权利要求1所述的神经网络训练方法,其中步骤S103包括:
将所述测试数据集中的测试数据输入经过训练的元模型神经网络,以得到所述测试数据的分类结果;
根据分类结果,计算所述测试数据的损失函数;以及
基于所述损失函数,对所述元模型神经网络的参数进行优化。
4.如权利要求3所述的神经网络训练方法,其中根据分类结果,计算所述测试数据的损失函数包括:
计算所述已知类别的测试数据在所述已知类别上的交叉熵作为第一损失函数;以及
计算所述未知类别的测试数据在所述已知类别上的交叉熵作为第二损失函数。
5.如权利要求4所述的神经网络训练方法,其中基于所述损失函数,对所述元模型神经网络的参数进行优化包括:
以使所述第一损失函数最小化为条件,按照所述第一损失函数对应的梯度更新所述元模型神经网络的参数;以及
以使所述第二损失函数最大化为条件,按照所述第二损失函数对应的梯度更新所述元模型神经网络的参数。
6.如权利要求1所述的神经网络训练方法,还包括:
将每个已知类别的训练数据和测试数据在特征空间中的分布形状预设为椭球形。
7.如权利要求1所述的神经网络训练方法,其中步骤S101包括:
对所述元模型神经网络的参数进行随机初始化。
8.如权利要求1所述的神经网络训练方法,其中所述元模型神经网络是resnet-18神经网络。
9.一种神经网络,通过如权利要求1-8中任一项所述的神经网络训练方法进行训练后得到。
10.一种非瞬时性计算机可读存储介质,具有存储于其上的指令,其中所述指令当被处理器执行时,实施如权利要求1-8中任一项所述的神经网络训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于虫极科技(北京)有限公司,未经虫极科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110288472.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高氧钢连铸用长水口
- 下一篇:一种中空纤维气体分离膜组件缺陷消除方法