[发明专利]一种模型训练方法、目标检测方法、以及相关设备在审
申请号: | 202110133274.8 | 申请日: | 2021-02-01 |
公开(公告)号: | CN114926701A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 黄泽昊;刘翱铭;王乃岩 | 申请(专利权)人: | 北京图森智途科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/02 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
地址: | 100000 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 目标 检测 以及 相关 设备 | ||
1.一种模型训练方法,其特征在于,包括:
获取训练样本集,所述训练样本集包括训练样本和验证样本;
获取所述训练样本对应的增强策略;
根据所述增强策略对所述训练样本进行增强操作,得到增强后训练样本;
通过初始模型对所述增强后训练样本进行预测;
基于对所述增强后训练样本的预测结果更新所述初始模型的参数,得到更新后模型;
通过所述更新后模型对所述验证样本进行预测;
基于对所述验证样本的预测结果更新所述增强策略,得到更新后增强策略;以及
根据所述更新后增强策略对所述更新后模型进行迭代训练,得到训练后模型。
2.根据权利要求1所述的方法,其特征在于,所述训练样本集为全量训练集中的部分样本集,所述根据所述更新后增强策略对所述更新后模型进行迭代训练,得到训练后模型,包括:
根据所述更新后增强策略对所述更新后模型进行迭代训练,得到最终的增强策略;
采用所述最终的增强策略对所述全量训练集进行增强操作;
基于增强后的全量训练集对所述更新后模型进行迭代训练,得到所述训练后模型。
3.根据权利要求2所述的方法,其特征在于,所述采用所述最终的增强策略对全量训练集进行增强操作,包括:
将所述全量训练集中的每一样本均采用所述最终的增强策略进行增强操作;或者
根据所述全量训练集和代理训练集的样本数比例,将每轮迭代后得到的更新后增强策略按比例映射到对应的全量训练集中。
4.根据权利要求1所述的方法,其特征在于,所述获取所述训练样本对应的增强策略,包括:
获取增强权重,根据所述增强权重确定所述训练样本对应的增强策略。
5.根据权利要求4所述的方法,其特征在于,所述根据所述增强权重确定所述训练样本对应的增强策略,包括:
根据增强权重采样多个增强策略;
所述根据所述增强策略对所述训练样本进行增强操作,得到增强后训练样本包括:
将采样得到的多个增强策略作用到不同的训练样本上,得到增强后的训练样本。
6.根据权利要求4所述的方法,其特征在于,所述获取增强权重,包括:
获取当前的增强概率,以及获取不同增强操作对应的执行概率;
根据所述增强概率和所述执行概率,确定所述增强策略对应的增强权重。
7.根据权利要求6所述的方法,其特征在于,所述增强概率的初始值为设定值;若增强操作库中包括K个增强操作,则每个增强操作所对应的执行概率的初始值为1/K;所述增强概率和执行概率在每轮迭代后被更新。
8.根据权利要求6所述的方法,其特征在于,所述根据所述增强概率和所述执行概率,确定所述增强策略对应的增强权重,包括:
将所述增强概率和所述增强策略所对应的多个增强操作的执行概率进行连乘操作,得到所述增强策略对应的增强权重。
9.根据权利要求5所述的方法,其特征在于,所述方法还包括:
从多个增强操作中筛选出满足条件的多个候选增强操作;
将所述多个候选增强操作划分为多个增强操作组;
基于每个增强操作组以及每个增强操作组中各增强操作的执行顺序生成多个增强策略。
10.根据权利要求1所述的方法,其特征在于,所述增强策略包括平移、旋转、裁剪、翻转、镜像、缩小、放大、噪声叠加、颜色变换、以及亮度调节中的任一种或多种组合的增强操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京图森智途科技有限公司,未经北京图森智途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110133274.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可以虚拟正装图像的上衣
- 下一篇:一种用于检维修作业的智能锁具