[发明专利]一种模型训练方法、装置、服务器及存储介质在审
申请号: | 202011576010.1 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112668639A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 辛永欣 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 徐彦圣 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 服务器 存储 介质 | ||
本发明公开了一种模型训练方法、装置、服务器及存储介质,所述方法包括:确定初始图像识别模型,以及用于模型训练的初始样本数量;将所述初始图像识别模型作为当前图像识别模型,将所述初始样本数量作为当前样本数量,执行模型参数调整步骤;基于N轮训练得到的N个梯度矩阵,确定是否需要对所述当前样本数量进行调整;若是,增加所述当前样本数量,将增加后的样本数量作为所述当前样本数量,再次执行所述模型参数调整步骤,直至完成所述初始图像识别模型的训练为止。本发明可以有效地提升模型训练的效率,使训练模型更快达到最优模型。
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型训练方法、装置、服务器及存储介质。
背景技术
随着科学技术的不断发展,图像识别技术被应用在越来越多的领域中,图像识别通常可以通过机器学习模型来实现。现有技术中,在使用机器学习模型对图像进行识别时,需要对机器模型进行迭代训练。在模型迭代训练过程中需要通过对模型参数进行调整以得到最优的机器模型。
超参数是在开始模型训练过程之前设置值的参数,而不是通过训练得到的参数数据,超参数有很多种,如学习率、网络层数、神经元节点数、Batch_Size(每次训练所选的样本数大小)等。在机器学习领域中,超参数的设置对于模型性能有着直接的影响,合适的超参数能够使模型更快收敛以达到最优模型。所以,如何优化超参数在深度学习中至关重要。
现有技术中,通常是使用手动调参、网格化寻优、随机寻优等方式来调整超参数。对于Batch_Size,现有技术中都是通过遍历所有取值来获取最优Batch_Size的。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
手动调参等方式使得模型优化训练效率低下、模型收敛速度慢,且浪费大量资源。
发明内容
本申请实施例通过提供一种模型训练方法、装置、服务器及存储介质,解决了现有技术中手动调参等方式使得模型优化训练效率低下、模型收敛速度慢,且浪费大量资源的技术问题,实现了提高模型训练效率、提升模型收敛速度、节约资源的技术效果。
第一方面,本申请提供一种模型训练方法,所述方法包括:
确定初始图像识别模型,以及用于模型训练的初始样本数量;
将所述初始图像识别模型作为当前图像识别模型,将所述初始样本数量作为当前样本数量,执行模型参数调整步骤,所述模型参数调整步骤包括:基于所述当前样本数量的样本图像,对所述当前图像识别模型进行N轮训练,得到与每轮训练对应的梯度矩阵;基于所述每轮训练对应的梯度矩阵,对模型参数进行调整,其中N为大于1的正整数;
基于N轮训练得到的N个梯度矩阵,确定是否需要对所述当前样本数量进行调整;若是,增加所述当前样本数量,将增加后的样本数量作为所述当前样本数量,再次执行所述模型参数调整步骤,直至完成所述初始图像识别模型的训练为止。
优选地,所述N轮训练得到的N个梯度矩阵,确定是否需要对所述当前样本数量进行调整,包括:
在所述N个梯度矩阵中确定出两个目标梯度矩阵;
基于所述两个目标梯度矩阵,确定是否需要对所述当前样本数量进行调整。
优选地,所述基于所述两个目标梯度矩阵,确定是否需要对所述当前样本数量进行调整,包括:
从所述两个目标梯度矩阵中抽取M组梯度向量组,其中,每组梯度向量组包含两个梯度向量,所述两个梯度向量分别位于所述两个目标梯度矩阵的相同位置,M为正整数;
计算所述每组梯度向量组中两个梯度向量的余弦值,并基于所述每组梯度向量组对应的余弦值,确定是否需要对所述当前样本数量进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011576010.1/2.html,转载请声明来源钻瓜专利网。