[发明专利]基于进化元学习模型训练的小样本特征分析方法及装置在审
申请号: | 202111520388.4 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114330650A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李书晓;朱承飞;朱晓萌 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 毛宏宝 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 进化 学习 模型 训练 样本 特征 分析 方法 装置 | ||
1.一种基于进化元学习模型训练的小样本特征分析方法,其特征在于,包括:
获取基类样本集合,以及目标样本集合;
基于所述基类样本集合,利用第一神经网络模型进行训练,得到预训练参数;
基于所述基类样本集合和所述预训练参数,利用进化元学习模型训练方法对第二神经网络模型进行训练,得到通用模型参数,其中,所述第二神经网络模型与所述第一神经网络模型的特征层具有相同的网络结构;
基于所述目标样本集合和所述通用模型参数,对所述第二神经网络模型进行调节,得到目标神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述利用进化元学习模型训练方法对第二神经网络模型进行训练,得到通用模型参数包括:
利用所述预训练参数中的特征层参数初始化所述第二神经网络模型的特征层参数,随机初始化所述第二神经网络模型其他网络层的参数;
从所述基类样本集合中随机采样多个与所述目标样本集合的规模相当的候选样本集合,对所述第二神经网络模型进行训练,得到各个候选样本集合的模型参数,并利用测试样本得到所述模型参数对应的类别准确率;
基于各个所述候选样本集合的模型参数及所述类别准确率,利用联邦计算和进化计算得到合成模型参数及后向代际各个所述候选样本集合的初始模型参数;
不断执行上述步骤从所述基类样本集合中随机采样多个与所述目标样本集合的规模相当的候选样本集合,对所述第二神经网络模型进行训练,得到各个候选样本集合的模型参数,并利用测试样本得到所述模型参数对应的类别准确率,基于各个所述候选样本集合的模型参数及所述类别准确率,利用联邦计算和进化计算得到合成模型参数及后向代际各个所述候选样本集合的初始模型参数,直至神经网络模型收敛,得到所述通用模型参数。
3.根据权利要求2所述的方法,其特征在于,所述类别准确率包括准确率统计值,所述准确率统计值的得到过程包括:
从所述基类样本集合中随机采样与所述候选样本集合同样任务的样本,得到所述测试样本;
利用所述测试样本对所述候选样本集合的模型参数进行有效性验证,得到分类准确率集合;
对所述分类准确率集合中的各个分类准确率进行统计,得到所述准确率统计值。
4.根据权利要求2所述的方法,其特征在于,所述基于各个所述候选样本集合的模型参数及所述类别准确率,利用联邦计算和进化计算得到合成模型参数及后向代际各个所述候选样本集合的初始模型参数包括:
对各个所述候选样本集合的模型参数,依据其对应的类别准确率进行筛选,将所述类别准确率最高的确定为优选模型参数;
对各个所述候选样本集合的模型参数及所述模型参数对应的所述类别准确率,利用联邦计算进行模型合成,得到所述合成模型参数;
在各个所述候选样本集合的模型参数和所述合成模型参数中,随机选取两个模型参数进行交叉处理,得到变异模型参数,循环执行,直至达到执行次数阈值,得到所述变异模型参数集合;
综合所述优选模型参数、所述合成模型参数和所述变异模型参数集合,确定后向代际各个所述候选样本集合的初始模型参数。
5.根据权利要求1所述的方法,其特征在于,所述对所述第二神经网络模型进行调节,得到目标神经网络模型包括:
利用所述通用模型参数对所述第二神经网络模型进行初始化,得到初始化神经网络模型;
在所述初始化神经网络模型的网络层中,固定全连接层之外的网络层的模型参数,利用所述目标样本集合对所述第二神经网络模型进行训练,直至收敛,得到所述目标神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111520388.4/1.html,转载请声明来源钻瓜专利网。