[发明专利]一种神经网络模型的训练方法、装置、电子设备及介质在审
申请号: | 202210609065.0 | 申请日: | 2022-05-31 |
公开(公告)号: | CN114898454A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 金百鑫;尚秉旭;陈志新;刘洋;王洪峰;张勇;何柳;张中举;许朝文 | 申请(专利权)人: | 中国第一汽车股份有限公司 |
主分类号: | G06V40/18 | 分类号: | G06V40/18;G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 刘欣 |
地址: | 130011 吉林省长*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 模型 训练 方法 装置 电子设备 介质 | ||
1.一种神经网络模型的训练方法,其特征在于,所述方法包括:
若待训练的神经网络模型不满足预先确定的收敛条件,则将预先采集到的多张图片划分为N个类型;其中,N为大于1的自然数;
将所述N个类型中的其中一个类型作为当前基准类型;并在所述当前基准类型的图片中提取出一张图片作为当前基准图片;
基于所述当前基准图片和所述当前基准类型中的图片以及所述当前基准类型以外的类型中的图片,构建一个当前阳性样本对和一个当前阴性样本对;
基于所述当前阳性样本对和所述当前阴性样本对,对待训练的神经网络模型进行训练,重复执行上述操作,直到所述待训练的神经网络模型满足所述收敛条件。
2.根据权利要求1所述的方法,其特征在于,所述基于所述当前基准图片和所述当前基准类型中的图片以及所述当前基准类型以外的类型中的图片,构建一个当前阳性样本对和一个当前阴性样本对,包括:
在所述当前基准类型中的图片中和所述当前基准类型以外的类型中的图片中,分别提取出一张图片作为当前阳性图片和当前阴性图片;
将所述当前基准图片和所述当前阳性图片组合为所述当前阳性样本对;将所述当前基准图片和所述当前阴性图片组合为所述当前阴性样本对。
3.根据权利要求1所述的方法,其特征在于,基于所述当前阳性样本对和所述当前阴性样本对,对待训练的神经网络模型进行训练,包括:
基于所述当前阳性样本对和当前次训练以前的阳性样本对,以及所述当前阴性样本对和当前次训练以前的阴性样本对,构建待训练的卷积神经网络在当前次训练中所对应的损失函数;
基于所述待训练的卷积神经网络在当前次训练中所对应的损失函数对所述待训练的卷积神经网络进行训练;重复执行上述操作,直到所述待训练的卷积神经网络满足对应的收敛条件;
基于所述当前基准图片构建所述待训练的分类器在当前次训练中所对应的损失函数;
基于所述待训练的分类器在当前次训练中所对应的损失函数对所述待训练的分类器进行训练;重复执行上述操作,直到所述待训练的分类器满足对应的收敛条件。
4.根据权利要求3所述的方法,其特征在于,所述基于所述当前阳性样本对和当前次训练以前的阳性样本对,以及所述当前阴性样本对和当前次训练以前的阴性样本对,构建待训练的卷积神经网络在当前次训练中所对应的损失函数,包括:
基于所述当前阳性样本对和当前次训练以前的阳性样本对,计算所述待训练的卷积神经网络在当前次训练中所对应的损失函数中的第一损失项;
基于所述当前阴性样本对和当前次训练以前的阴性样本对,计算所述待训练的卷积神经网络在当前次训练中所对应的损失函数中的第二损失项;
将所述待训练的卷积神经网络在当前次训练中所对应的损失函数中的第一损失项和所述待训练的卷积神经网络在当前次训练中所对应的损失函数中的第二损失项求和,得到所述待训练的卷积神经网络在当前次训练中所对应的损失函数。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将当前图片输入至训练好的神经网络模型中,通过所述训练好的神经网络模型得到所述当前图片的特征向量;
将所述当前图片的特征向量输入至预先训练好的分类器中,通过所述训练好的分类器对所述当前图片进行识别,得到所述当前图片所对应的识别结果。
6.一种神经网络模型的训练装置,其特征在于,所述装置包括:划分模块、提取模块、构建模块和训练模块;其中,
所述划分模块,用于若待训练的神经网络模型不满足预先确定的收敛条件,则将预先采集到的多张图片划分为N个类型;其中,N为大于1的自然数;
所述提取模块,用于将所述N个类型中的其中一个类型作为当前基准类型;并在所述当前基准类型的图片中提取出一张图片作为当前基准图片;
所述构建模块,用于基于所述当前基准图片和所述当前基准类型中的图片以及所述当前基准类型以外的类型中的图片,构建一个当前阳性样本对和一个当前阴性样本对;
所述训练模块,用于基于所述当前阳性样本对和所述当前阴性样本对,对待训练的神经网络模型进行训练,重复执行上述操作,直到所述待训练的神经网络模型满足所述收敛条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国第一汽车股份有限公司,未经中国第一汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210609065.0/1.html,转载请声明来源钻瓜专利网。