[发明专利]神经网络模型的训练方法及装置在审
申请号: | 202210278147.1 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114694216A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 刘弘也;苏驰;李凯;王育林 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 沈园园 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 | ||
本申请实施例提供了一种神经网络模型的训练方法及装置,其中,该方法包括:获取第一数据集,其中,所述第一数据集包括N张目标人脸图像,所述目标人脸图像上标注有用于表征年龄的标识;N为正整数;基于所述第一数据集生成第二数据集,其中,所述第二数据集包括所述第一数据集中部分图像的多种图像序列;基于所述第二数据集对预设的第一神经网络模型进行训练,得到第二神经网络模型;基于所述第一数据集对调整后的所述第二神经网络模型进行训练,得到目标神经网络模型。通过本申请,解决了现有技术中深度人脸年龄估计算法直接在小规模的年龄数据集上进行训练,导致模型容易过拟合以使模型泛化能力较差的问题。
技术领域
本申请涉及神经网络领域,特别是涉及一种神经网络模型的训练方法及装置。
背景技术
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。自动人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计算机视觉领域内一个热门的研究课题。人脸年龄估计问题的定义是指采用计算机视觉等技术根据输入的人脸图像自动估计出其真实年龄。虽然大量的研究者为解决年龄估计问题付出了艰辛的努力,但该问题远远没有得到解决且仍然面临着许多严峻的困难和挑战,其中最突出的困难是年龄数据集规模较小。具体来说,由于涉及到个人隐私,收集带有年龄标签的人脸样本是非常困难、昂贵且耗时的,这导致常用的年龄估计数据集样本规模都比较小,由于深度学习非常依赖于大数据,小规模的年龄数据集使得深度模型非常容易过拟合,导致模型最终的泛化能力较差。
发明内容
本申请实施例的目的在于提供一种神经网络模型的训练方法及装置,以解决现有技术中深度人脸年龄估计算法直接在小规模的年龄数据集上进行训练,导致模型容易过拟合以使模型泛化能力较差的问题。具体技术方案如下:
在本申请实施的第一方面,首先提供了一种神经网络模型的训练方法,包括:获取第一数据集,其中,所述第一数据集包括N张目标人脸图像,所述目标人脸图像上标注有用于表征年龄的标识;N为正整数;基于所述第一数据集生成第二数据集,其中,所述第二数据集包括所述第一数据集中部分图像的多种图像序列;基于所述第二数据集对预设的第一神经网络模型进行训练,得到第二神经网络模型;基于所述第一数据集对调整后的所述第二神经网络模型进行训练,得到目标神经网络模型。
在本申请实施的第二方面,还提供了一种神经网络模型的训练装置,包括:获取模块,用于获取第一数据集,其中,所述第一数据集包括N张目标人脸图像,所述目标人脸图像上标注有用于表征年龄的标识;N为正整数;生成模块,用于基于所述第一数据集生成第二数据集,其中,所述第二数据集包括所述第一数据集中部分图像的多种图像序列;第一训练模块,用于基于所述第二数据集对预设的第一神经网络模型进行训练,得到第二神经网络模型;第二训练模块,用于基于所述第一数据集对调整后的所述第二神经网络模型进行训练,得到目标神经网络模型。
在本申请实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的主机操作的随机测试方法。
在本申请实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的主机操作的随机测试方法。
本申请实施例中,可以基于第一数据集中的人脸图像生成的第二数据集中的多种图像序列对第一神经网络模型进行训练得到第二神经网络模型,然后对第二神经网络模型进行调整,并基于第一数据集对调整后的第二神经网络模型进行训练,得到最终的目标神经网络模型,也就是说,在本申请实施例中可以先利用自动生成的图像序列对神经网络模型模型进行预训练;然后将预训练的神经网络模型在原始的人脸年龄数据集上进行微调,即通过数量较大的图像序列的预训练缓解了样本数量少对模型训练带来的负面影响,增加了模型的泛化能力,从而解决了现有技术中深度人脸年龄估计算法直接在小规模的年龄数据集上进行训练,导致模型容易过拟合以使模型泛化能力较差的问题。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210278147.1/2.html,转载请声明来源钻瓜专利网。