[发明专利]一种机器学习模型的训练方法、装置和可读存储介质在审
申请号: | 202111350153.5 | 申请日: | 2021-11-15 |
公开(公告)号: | CN114219095A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张兴明;周旭亚;陈波扬;黄鹏 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 学习 模型 训练 方法 装置 可读 存储 介质 | ||
本申请公开了一种机器学习模型的训练方法、装置和可读存储介质,该方法包括:获取多个第一训练样本;对第一训练样本进行第一随机增强处理,得到第二训练样本;在基于预设增强总数判断到第二训练样本满足预设增强条件后,对第二训练样本进行第二随机增强处理,得到第三训练样本,预设增强总数为批处理数量的约数;利用训练样本对机器学习模型进行训练,得到训练完的机器学习模型,训练样本包括第二训练样本或第三训练样本,批处理数量为每次输入至机器学习模型的训练样本的数量。通过上述方式,本申请能够加速模型的收敛速度。
技术领域
本申请涉及机器学习技术领域,具体涉及一种机器学习模型的训练方法、装置和可读存储介质。
背景技术
为了获得比较好的模型训练效果,有些方案在模型训练前进行数据清理操作,即对获取到的数据进行筛选来获取精选数据,以组成训练数据,供模型训练使用,从而提高模型训练的效率,但可能使模型容易过拟合,导致在真实场景中模型检测或者分类的能力不足;还有些方案在每次迭代时随机选取部分原始训练数据(比如:图像、文本或语音),然后进行随机剪切(crop)、随机缩放(resize)或随机色调调整等增强方式,来提高模型的泛化能力,但在连续的迭代训练中,训练数据仍可能会偏重某一特征,导致模型的权重在某一时间段中全部都是针对某一特征进行更新,使得在整个训练过程中损失(loss)波动很大,不仅导致训练时间无限增长,还可能导致训练无法收敛。
发明内容
本申请提供一种机器学习模型的训练方法、装置和可读存储介质,能够加速模型的收敛速度。
为解决上述技术问题,本申请采用的技术方案是:提供一种机器学习模型的训练方法,该方法包括:获取多个第一训练样本;对第一训练样本进行第一随机增强处理,得到第二训练样本;在基于预设增强总数判断到第二训练样本满足预设增强条件后,对第二训练样本进行第二随机增强处理,得到第三训练样本,预设增强总数为批处理数量的约数;利用训练样本对机器学习模型进行训练,得到训练完的机器学习模型,训练样本包括第二训练样本或第三训练样本,批处理数量为每次输入至机器学习模型的训练样本的数量。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种电子装置,该电子装置包括互相连接的存储器和处理器,其中,存储器用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的机器学习模型的训练方法。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的机器学习模型的训练方法。
通过上述方案,本申请的有益效果是:先对获取到的第一训练样本进行第一随机增强处理,得到第二训练样本;然后利用预设增强总数来判断当前的第二训练样本是否满足预设增强条件,如果当前的第二训练样本满足预设增强条件,则对第二训练样本进行第二随机增强处理,得到第三训练样本;如果当前的第二训练样本不满足预设增强条件,则不作处理,从而实现对第二训练样本的选择性第二随机增强处理;然后使用第二训练样本和/或第三训练样本训练机器学习模型;通过采用至少一次随机增强处理,增加了训练样本的多样性,不会出现模型过拟合的现象,而且所有待训练的特征在整个训练过程中尽可能均匀地参与训练,不会导致在某一时段模型中的权重更新过于单一,权重更新更加均衡,进而使得在训练过程中损失值不会产生巨大波动,有助于加速机器学习模型的收敛速度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请提供的机器学习模型的训练方法一实施例的流程示意图;
图2是本申请提供的机器学习模型的训练方法另一实施例的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111350153.5/2.html,转载请声明来源钻瓜专利网。