[发明专利]神经网络模型的训练方法和装置、电子设备和计算机存储介质有效
申请号: | 201710351624.1 | 申请日: | 2017-05-18 |
公开(公告)号: | CN108229676B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 钱晨;胡杰 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 电子设备 计算机 存储 介质 | ||
本发明实施例公开了一种神经网络模型的训练方法和装置、电子设备和计算机存储介质。其中,方法包括:基于多次选取的训练样本子集分别调整神经网络模型的网络参数,直至满足神经网络模型训练的停止条件;其中,所述多次选取中至少两次训练样本子集选取的类别和/或样本不同,且每次训练样本子集的选取包括:从包含有n个类别的类别列表中选取t个类别、并从所述t个类别的每个类别分别对应的样本列表中选取至少一个样本,得到一训练样本子集;其中,n和t均为整数,且1t≤n。本发明实施例可以提高网络模型预测结果的精度,提升网络模型总体的性能。
技术领域
本发明属于机器学习领域,特别是涉及一种神经网络模型的训练方法和装置、电子设备和计算机存储介质。
背景技术
目前,机器学习技术已经广泛应用于各行各业中,特别是深度学习技术,已经取得了巨大的成果。其中,有监督学习是以大量有类别标注的样本为基础,从这些样本中学习到类别内的各样本特征的共性和类别间的各样本特征的差异,并用这些学习到的特征来指导对新样本类别的预测。
然而,在实际应用中,由于通常需要训练的样本的类别较多,每次需要从所有类别的所有样本中选取一批样本进行训练,这样就会导致样本较多的类别的样本每次被选中的概率较大,训练得到的网络模型对这些类别优化较好,样本较少的类别的样本每次被选中的概率较小,训练得到的网络模型对这些类别优化较差,例如,在图像分类任务中,有些类别比较稀少、不常见,能够收集到的图像样本非常有限,如熊猫,而有些类别涵盖范围比较广泛,可以轻松收集到大量的图像样本,如动物,由于不同类别的训练样本不均衡造成的网络模型的性能损失,会使得网络模型预测结果的精度下降,从而影响网络模型总体的性能。
发明内容
本发明实施例提供一种神经网络模型训练的技术方案。
根据本发明实施例的一个方面,提供一种神经网络模型的训练方法,包括:
基于多次选取的训练样本子集分别调整神经网络模型的网络参数,直至满足神经网络模型训练的停止条件;其中,所述多次选取中至少两次训练样本子集选取的类别和/或样本不同,且每次训练样本子集的选取包括:从包含有n个类别的类别列表中选取t个类别、并从所述t个类别的每个类别分别对应的样本列表中选取至少一个样本,得到一训练样本子集;其中,n和t均为整数,且1t≤n。
根据本发明实施例的另一个方面,提供一种神经网络模型的训练装置,包括:
选取单元,用于从包含有n个类别的类别列表中选取t个类别、并从所述t个类别的每个类别分别对应的样本列表中选取至少一个样本,得到一训练样本子集;其中,n和t均为整数,且1t≤n;
训练单元,用于基于多次选取的训练样本子集分别调整神经网络模型的网络参数,直至满足神经网络模型训练的停止条件;其中,所述多次选取中至少两次训练样本子集选取的类别和/或样本不同。
根据本发明实施例的又一个方面,提供的一种电子设备,包括上述任一实施例所述的神经网络模型的训练装置。
根据本发明实施例的再一个方面,提供的一种电子设备,包括:
存储器,用于存储可执行指令;以及
处理器,用于与所述存储器通信以执行所述可执行指令从而完成上述任一实施例所述的神经网络模型的训练方法的操作。
根据本发明实施例的再一个方面,提供的一种计算机存储介质,用于存储计算机可读取的指令,所述指令被执行时执行上述任一实施例所述的神经网络模型的训练方法的操作。
根据本发明实施例的再一个方面,提供一种计算机设备,包括:
存储器,存储可执行指令;
处理器,与存储器通信以执行可执行指令从而完成本发明上述任一实施例所述的神经网络模型的训练方法对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710351624.1/2.html,转载请声明来源钻瓜专利网。