[发明专利]一种用于神经网络的训练方法以及相关设备在审
申请号: | 202010680648.3 | 申请日: | 2020-07-15 |
公开(公告)号: | CN111950596A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 叶翰嘉;洪蓝青;杨扩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 李杭 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 神经网络 训练 方法 以及 相关 设备 | ||
本申请涉及人工智能领域中的元学习技术,公开了一种用于神经网络的训练方法以及相关设备。方法包括:将第一样本子集合输入第一神经网络,生成第一查询样本的第一特征信息和第一预测结果,根据与样本集合包括的M组支持样本对应的第二特征信息、第一标注结果和第一特征信息,生成第一查询样本的第二预测结果,对第一神经网络进行训练;第一损失函数指示第一预测结果和第二标注结果之间的相似度,第二损失函数指示第一预测结果与第二预测结果之间的相似度,或指示第二预测结果和第二标注结果之间的相似度。同时学习一个小样本任务中不同样本在特征维度的区别以及多个小样本任务对应的多个类别的样本在特征维度的区别,提高预测结果的精度。
技术领域
本申请涉及人工智能领域,尤其涉及一种用于神经网络的训练方法以及相关设备。
背景技术
人工智能(Artificial Intelligence,AI)是利用计算机或者计算机控制的机器模拟、延伸和扩展人的智能。人工智能包括研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。目前,对基于深度学习的神经网络进行小样本学习(few-shot learning)是人工智能一种可行的研究方向。
元学习(meta-learning)是小样本学习研究中的一个重要的分支。元学习的主要思想是当目标任务的训练样本较少时,通过使用大量与目标小样本任务相似的小样本任务来训练神经网络,以使训练后的神经网络在目标任务上有着不错的初始值,然后利用少量的目标小样本任务的训练样本对训练后的神经网络进行调整。
但最后得到的神经网络输出的预测结果的精度依旧较低,因此,一种在采用元学习的方式进行训练的前提下,能够提高神经网络输出的预测结果的精度的训练方案亟待推出。
发明内容
本申请实施例提供了一种用于神经网络的训练方法以及相关设备,在一个小样本任务的训练过程中不仅学习到一个小样本任务中支持样本的特征,而且学习到M组支持样本的特征,也即神经网络在一个小样本学习中不仅能够学习到一个小样本任务内的相对关系,而且能够学习到多个小样本任务之间的绝对关系,从而提高输出的预测结果的精度。
为解决上述技术问题,本申请实施例提供以下技术方案:
第一方面,本申请实施例提供一种神经网络的训练方法,可用于人工智能领域的元学习领域中。方法包括:训练设备从样本集合中获取第一样本子集合,样本集合包括M组支持样本和M组查询样本,第一样本子集合包括第一支持样本和第一查询样本;训练设备还获取每个第一支持样本的标注结果。训练设备将第一样本子集合和每个第一支持样本的标注结果输入至第一神经网络,第一神经网络生成第一查询样本的第一特征信息,并得到第一神经网络输出的与第一查询样本对应的第一预测结果,第一预测结果为根据第一支持样本的特征信息和第一特征信息之间的相似度以及每个第一支持样本的标注结果生成的。训练设备根据与M组支持样本对应的M个第二特征信息、与M组支持样本对应的M个第一标注结果和第一查询样本的第一特征信息,生成与第一查询样本对应的第二预测结果。M个第二特征信息中的每一个均指示M组支持样本中一组支持样本的特征,M个第一标注结果中的每一个均指示与M组支持样本中一组支持样本对应的正确结果。训练设备根据第一损失函数和第二损失函数,对第一神经网络进行迭代训练,直至满足预设条件。其中,第一损失函数指示第一预测结果和第二标注结果之间的相似度,第二损失函数指示第一预测结果与第二预测结果之间的相似度,或者,第二损失函数指示第二预测结果和第二标注结果之间的相似度,第二标注结果为第一查询样本的正确结果。第一损失函数和第二损失函数均可以为交叉熵损失函数或相对熵损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010680648.3/2.html,转载请声明来源钻瓜专利网。