[发明专利]一种模型训练方法及装置在审
申请号: | 202111613829.5 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114511752A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 陈文浩;刘圣阳;朱贵冬;高山;金吉成 | 申请(专利权)人: | 广州海格星航信息科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06K9/62;G06V20/56;G06V10/762 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 | ||
本发明公开了一种模型训练方法及装置,所述方法包括:当判定待训练模型处于新增样本的过程中时,计算新增样本数量度量和新增样本目标特征差异性度量;根据新增样本数量度量和新增样本目标特征差异性度量,计算综合度量;当判定综合度量大于第一预设数值时,训练待训练模型,直至判定待训练模型不处于新增样本的过程中时,完成模型训练。采用本发明实施例能实现模型的不断迭代优化、提高优化效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种模型训练方法及装置。
背景技术
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,已远超过相关传统技术。
深度学习在ADAS系统中应用广泛,尤其是基于目标检测的深度学习算法,是完成基于图像的车辆检测、行人检测、车道线检测等多种任务的技术基础。在实际应用中,ADAS使用场景非常复杂,需要提高目标检测模型的泛化能力。
现有技术中,可以通过以下角度训练模型从而提高模型的泛化能力,所述角度包括:数据角度、模型设计角度和模型训练角度等。但是在实际应用中,虽然上述模型训练方法无法实现模型的不断迭代优化、存在效率低下的问题。
发明内容
本发明实施例提供一种模型训练方法及装置,能够实现模型的不断迭代优化、提高优化效率。
本申请实施例的第一方面提供了一种模型训练方法,包括:
当判定待训练模型处于新增样本的过程中时,计算新增样本数量度量和新增样本目标特征差异性度量;
根据新增样本数量度量和新增样本目标特征差异性度量,计算综合度量;
当判定综合度量大于第一预设数值时,训练待训练模型,直至判定待训练模型不处于新增样本的过程中时,完成模型训练。
在第一方面的一种可能的实现方式中,计算新增样本数量度量,具体为:
将新增样本数量的初始值设置为零,当判定待训练模型处于新增样本的过程中时,更新新增样本数量,得到第一新增样本数量;
当判定第一新增样本数量大于第二预设数值时,将第一新增样本数量作为新增样本数量度量。
在第一方面的一种可能的实现方式中,计算新增样本目标特征差异性度量,具体为:
当判定待训练模型处于新增样本的过程中时,计算第一特征向量和第二特征向量之间的第一聚类中心距离;其中,第一特征向量为原有样本的目标特征向量,第二特征向量为新增样本的目标特征向量;
当第一聚类中心距离大于第三预设数值时,记为第二聚类中心距离;
计算第二聚类中心距离的数量,将第二聚类中心距离的数量作为新增样本目标特征差异性度量。
在第一方面的一种可能的实现方式中,在计算新增样本数量度量和新增样本目标特征差异性度量之后,还包括:
根据新增样本更新原有样本集。
在第一方面的一种可能的实现方式中,判定待训练模型处于新增样本的过程中,具体为:
当待训练模型已经开始或正在持续进行新增样本的采集与标注,则判定待训练模型处于新增样本的过程中。
本申请实施例的第二方面提供了一种模型训练装置,包括:第一计算模块、第二计算模块和训练模块;
其中,第一计算模块用于当判定待训练模型处于新增样本的过程中时,计算新增样本数量度量和新增样本目标特征差异性度量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州海格星航信息科技有限公司,未经广州海格星航信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111613829.5/2.html,转载请声明来源钻瓜专利网。