[发明专利]一种模型训练方法、目标检测方法、以及相关设备在审
申请号: | 202110133274.8 | 申请日: | 2021-02-01 |
公开(公告)号: | CN114926701A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 黄泽昊;刘翱铭;王乃岩 | 申请(专利权)人: | 北京图森智途科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/02 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
地址: | 100000 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 目标 检测 以及 相关 设备 | ||
本申请实施例公开了一种模型训练方法、目标检测方法、以及相关设备,本申请实施例可以获取训练样本集,所述训练样本集包括训练样本和验证样本;获取所述训练样本对应的增强策略;根据所述增强策略对所述训练样本进行增强操作,得到增强后训练样本;通过初始模型对所述增强后训练样本进行预测;基于对所述增强后训练样本的预测结果更新所述初始模型的参数,得到更新后模型;通过所述更新后模型对所述验证样本进行预测;基于对所述验证样本的预测结果更新所述增强策略,得到更新后增强策略;根据所述更新后增强策略对所述更新后模型进行迭代训练,得到训练后模型。本申请实施例提高了对模型训练准确性和精度。
技术领域
本申请涉及数据处理技术领域,具体涉及一种模型训练方法、目标检测方法、以及相关设备。
背景技术
数据增强是防止深度神经网络过拟合的关键技术,因此,合适的数据增强策略对于深度神经网络模型的表现有着非常重要的影响,一般是通过人工选择数据增强策略来进行数据增强,但是人工选择数据增强策略的效率非常低,进而出现了自动数据增强,自动数据增强是指针对不同的任务或数据集,通过特定的搜索优化方法来自动找到最合适的数据增强策略。
现有的自动数据增强技术可以大致分为两类,一类是不可微分的自动数据增强技术,这类技术主要通过增强学习、启发式搜索算法或贝叶斯优化来实现数据增强策略的搜索优化(例如AutoAugment)。具体地,可以设计一个数据增强的搜索空间,每一种策略由多个子策略组成,子策略包含两个图像处理操作,如平移、旋转或剪切等,对于每一个操作都有一组概率和幅度来表征这个操作的使用性质。搜索算法由控制器和优化算法组成,控制器产生每一步的数据增强策略决策,然后将决策作为下一步操作的嵌入向量。每一步采样一个数据增强策略,并用这个策略在从训练集中采样出来的一个小型代理数据集上训练一个模型,所训练模型在代理验证集上的表现作为奖励信号来优化控制器。该自动数据增强技术能够实现较好数据增强技术搜索,但是由于采样与优化效率的限制,搜索的时间成本往往较高,以及搜索到的数据增强可靠性低,从而降低了对模型训练的准确性和精度。
另一类是可微分的自动数据增强技术,采用Gumbel-Softmax等近似技术来将数据增强搜索转化为可微分优化问题,例如代表技术为自动数据增强搜索方式(Differentiable Automatic Data Augmentation,DADA)。具体地,首先将数据增广策略搜索形式化为类别分布(Categorical Distribution)采样问题,对每个子策略里每个操作的概率作为伯努利分布(Bernoulli Distribution)采样问题。然后通过gumbel-softmax技术来将上述分布参数的优化松弛为一个可微分优化问题,并通过使用RELAX估计器估计上述分布的梯度,同时使用二阶梯度估计技术来提升搜索速度。DADA使用基于一步梯度更新的元学习来交替优化模型权重和数据增广策略参数梯度。可微分的自动数据增强技术虽然能够提升搜索的效率,但是在实现可微分搜索的过程中,需要使用很多的近似技术,例如使用gumbel-softmax来实现可微分松弛,或者使用REINFORCE等估计器来估计数据增强参数的梯度,这些近似技术一方面造成了技术上的复杂性,限制了自动数据增强技术的广泛使用,另一方面可能引入不准确的近似,导致搜索到的数据增强测率性能不强,降低了对模型训练的准确性和精度。
发明内容
本申请实施例提供一种模型训练方法、目标检测方法、以及相关设备,其中,相关设备可以包括模型训练装置、目标检测装置、计算机设备及计算机可读存储介质,本申请实施例可以提高对模型训练准确性和精度。
为解决上述技术问题,本申请实施例提供以下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京图森智途科技有限公司,未经北京图森智途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110133274.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可以虚拟正装图像的上衣
- 下一篇:一种用于检维修作业的智能锁具