[发明专利]一种基于自适应模型不可知元学习的小样本目标识别方法在审
申请号: | 202011388919.4 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112560904A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 庄连生;李厚强;杨健;樊硕 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 张乾桢 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 模型 不可知 学习 样本 目标 识别 方法 | ||
本发明提供了一种基于自适应模型不可知元学习的小样本目标识别算法,包括:步骤S101:初始化基于自适应模型不可知元学习的小样本目标识别模型参数;步骤S201:使用元学习方法对任务具体参数进行迭代更新;步骤S301:利用合成梯度方向优化小样本识别模型。本发明在保持了一阶MAML算法的基本特性的同时,有效提升了一阶MAML算法的模型泛化能力,提升了模型收敛速度,同时保持着和一阶MAML算法几乎一致的时空开销。
技术领域
本发明属于机器学习中的小样本学习领域,具体涉及一种基于自适应模型不可知元学习的小样本目标识别算法(以下简称为:基于自适应MAML的小样本目标识别算法)的构建方法。
背景技术
现有的机器学习方法可以很好解决大容量均衡数据集下的分类任务,但在进行小样本学习时会因数据量不足导致欠拟合从而表现不佳。能否仅利用少量数据来训练就得到一个好的模型,成为了小样本学习的关键问题。
元学习可以很好的处理小样本分类任务,它旨在让机器学会学习,以一种系统的、数据驱动的方法,在多个近似的小样本分类任务上进行预学习,从而在面对新任务的时候采用先前学习到的知识,指导自己的决策过程并以此适应新的任务,使模型达到快速学习的目的。
与本发明密切相关的小样本目标识别算法是模型不可知元学习(MAML)算法。但是MAML算法在外层更新阶段需要计算二阶梯度,这导致训练过程会占据大量的时空开销。目前存在一系列一阶MAML算法,通过忽略二阶梯度项来简化计算(FOMAML、Repti le),但是丢失了部分梯度信息,从而导致不同程度的精度损失。
发明内容
为了解决上述机器学习领域中的小样本分类问题,本发明提供了一种基于自适应模型不可知元学习的小样本目标识别方法,包括:
步骤S101:初始化基于自适应模型不可知元学习的小样本识别模型参数;
步骤S201:使用元学习方法对任务具体参数进行迭代更新;
步骤S301:利用合成梯度方向优化小样本识别模型。
进一步的,所述步骤S101包括:
对基于自适应不可知元学习的小样本识别模型参数进行初始化,参数包括:元模型参数θ、内层循环学习率α、外层元循环学习率β、内层循环超梯度步长α0和外层元循环超梯度步长β0。
进一步的,所述步骤S201包括:
子步骤S201a:根据辅助数据集划分元学习任务;
子步骤S201b:将划分好的元学习任务输入基于自适应模型不可知元学习的小样本识别模型;
子步骤S201c:根据随机梯度下降算法更新任务具体参数。
进一步的,所述子步骤S201a:根据辅助数据集划分元学习任务具体包括:
按照N-类、K-样本格式划分小样本学习任务,并且默认选择5-类、3-样本格式进行说明,5-类、3-样本是指从辅助数据集中采样出5类,每类4个样本,并将其分割为支持集和查询集,支持集包含5类,每类3个样本,查询集包含5类中每类剩余的1个样本,模型在支持集上对每个任务进行训练,在查询集上验证训练精度。
进一步的,所述子步骤S201c:根据划分好的元学习任务,使用随机梯度下降算法更新任务具体参数,更新任务具体参数的表达式为:
其中,表示元学习任务i的第j步任务具体参数;αt表示第t次迭代的内层循环学习率;表示连续函数的梯度运算;Li表示评估元学习任务i的损失函数,k为小样本学习任务数量。
进一步的,所述步骤S301包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011388919.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于座椅骨架的折弯方法
- 下一篇:一种肾病药物组合物及其制备方法