[发明专利]一种分类模型训练方法、对象分类方法及相关设备在审
申请号: | 202111369647.8 | 申请日: | 2021-11-16 |
公开(公告)号: | CN114118242A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李鑫武;丁华杰;金悦 | 申请(专利权)人: | 中汽创智科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 方秀琴;贾允 |
地址: | 211100 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分类 模型 训练 方法 对象 相关 设备 | ||
本申请涉及一种分类模型训练方法、对象分类方法及相关设备,该分类模型训练方法包括:获取训练样本集合;训练样本集合包括多个样本子集合,多个样本子集合对应多个不同种类的类别标签;构建预设机器学习模型;基于预设机器学习模型,对训练样本集合中每个训练样本进行类别预测,得到每个训练样本的预测类别信息;预测类别信息是基于多个样本子集合中各样本子集合中的样本数量和训练样本的特征输出指数确定的;基于每个训练样本的预测类别信息与每个训练样本的类别标签确定损失值;根据损失值对预设机器学习模型进行训练直至满足预设训练结束条件,得到分类模型。如此,可以提高分类模型的识别准确度,可以提高其在汽车领域应用的安全性。
技术领域
本申请涉及机器学习技术领域,特别涉及一种分类模型训练方法、对象分类方法及相关设备。
背景技术
目前深度学习已经成为人工智能领域的研究热门,在自动驾驶领域上更是应用广泛,尤其是在视觉感知上,在车辆上引入视觉能够使车辆对周边的环境进行目标检测、目标分类、图像分割等,从而有效提升车辆的安全性、稳定性、智能性。自动驾驶需要感知的对象庞杂,存在天然的数据不平衡问题,无法对每个对象采集足够多的样本数据,比如异型车、红绿灯等。在自动驾驶中,由于汽车行驶过程中安全的重要性,少见的样本数据依然会给汽车带来极大的安全隐患,所以研究不平衡数据学习方法具有重要意义。
不平衡数据学习算法的核心是消除常见样本对模型的影响,使模型更好的学习少见数据样本。然而,传统的不平衡数据学习仅从数据集特征学习上进行均衡,无法有效解决训练过程中的梯度贡献问题,并不能很好地满足感知任务中对于感知对象的精度要求。因此,亟需提高现有不均衡数据学习模型对少见样本的识别准确度。
发明内容
本申请实施例提供了一种分类模型训练方法、对象分类方法及相关设备,可以提高分类模型的识别准确度,可以提高其在汽车领域应用的安全性。
一方面,本申请实施例提供了一种分类模型训练方法,包括:
获取训练样本集合;训练样本集合包括多个样本子集合,多个样本子集合对应多个不同种类的类别标签;
构建预设机器学习模型;
基于预设机器学习模型,对训练样本集合中每个训练样本进行类别预测,得到每个训练样本的预测类别信息;预测类别信息是基于多个样本子集合中各样本子集合中的样本数量和训练样本的特征输出指数确定的;
基于每个训练样本的预测类别信息与每个训练样本的类别标签确定损失值;
根据损失值对预设机器学习模型进行训练直至满足预设训练结束条件,得到分类模型。
可选的,每个训练样本的预测类别信息包括各类别对应的预测概率值;基于每个训练样本的预测类别信息与每个训练样本的类别标签确定损失值,包括:
获取损失函数;
针对每个训练样本:将各类别对应的预测概率值中的最大预测概率值对应的类别确定为准目标类别,将最大预测概率值确定为准目标概率值;
确定准目标概率值对应的非准目标概率值;非准目标概率值与准目标概率值之和为第一预设数值;
根据损失函数,确定非准目标概率值与每个训练样本的类别标签对应的真实值之间的损失值。
可选的,多个样本子集合中任意一个样本子集合的样本数量大于等于第二预设数值;第二预设数值根据多个样本子集合中样本数量大于等于第一阈值的样本子集合的样本数量确定。
可选的,获取训练样本集合,包括:
获取不均衡的初始训练样本集合;初始训练样本集合包括多个初始样本子集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中汽创智科技有限公司,未经中汽创智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111369647.8/2.html,转载请声明来源钻瓜专利网。