[发明专利]一种自动驾驶感知模型的训练方法、装置、设备和介质有效
申请号: | 202310134421.2 | 申请日: | 2023-02-10 |
公开(公告)号: | CN115879535B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 张伟;谭啸;林相如;叶晓青;韩钧宇;王井东;丁二锐;吴甜;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/0895 | 分类号: | G06N3/0895;G06N3/084;G06N3/096;G06N3/0464;G06F18/25 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 蔡舒野 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 驾驶 感知 模型 训练 方法 装置 设备 介质 | ||
1.一种自动驾驶感知模型的训练方法,包括:
获取一种或多种模态的训练样本;其中,所述训练样本包括有标注数据和无标注数据;
采用设定场景的有标注数据对感知模型进行场景化训练;
确定场景化后的感知模型的性能指标;
根据所述性能指标从多种半监督训练方式中选择与所述性能指标匹配的一种半监督训练方式;其中,所述多种半监督训练方式包括自迭代训练方式和在线半监督训练方式;
采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;
采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。
2.根据权利要求1所述的方法,其中,多种模态的训练样本至少包括图像和点云。
3.根据权利要求1所述的方法,其中,采用所述训练样本对场景化后的感知模型进行半监督训练,以更新感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中包括:
将场景化后的感知模型作为教师模型,从所述训练样本中获取第一无标注数据;
采用第一无标注数据对所述教师模型进行训练,输出预测结果;
根据当前输出的预测结果进行性能测试,并确定测试的性能指标是否收敛;
如果确定测试的性能指标收敛,则将当前输出的预测结果,作为第一无标注数据的伪标注结果,以形成伪标注数据并添加至训练样本中;
如果确定测试的性能指标不收敛,则根据当前输出的预测结果对所述教师模型进行更新,并返回执行采用第一无标注数据对更新后教师模型进行训练的操作。
4.根据权利要求3所述的方法,其中,将当前输出的预测结果作为第一无标注数据的伪标注结果,以形成伪标注数据并添加至训练样本中包括:
将当前输出的预测结果作为第一无标注数据的伪标注结果,对所述伪标注结果按照设定规则进行筛选;
将筛选后的无标注数据和伪标注结果,形成为伪标注数据,并添加至训练样本中。
5.根据权利要求4所述的方法,其中,对所述伪标注结果按照设定规则进行筛选包括:
验证所述伪标注结果中不同子任务标注结果的一致性;
根据一致性结果筛选伪标注结果。
6.根据权利要求1所述的方法,其中,所述感知模型包括预处理网络、主体网络和多任务输出网络。
7.根据权利要求6所述的方法,其中:
所述预处理网络中包括一个或多个预处理分支模块,用于分别处理对应模态的训练样本,形成预处理样本;
所述主体网络用于对输入的预处理样本进行特征处理;
所述多任务输出网络包括多个子任务分支模块,用于分别根据所述主体网络的输出数据,识别对应子任务的自动驾驶感知结果。
8.根据权利要求7所述的方法,其中,所述子任务分支模块对应的子任务包括下述至少一种:2D框检测任务、3D框检测任务、语义分割任务、车道线分割任务、以及物体跟踪任务。
9.根据权利要求7所述的方法,其中,所述设定场景的有标注数据的标注结果,对应于至少一个子任务的预测结果。
10.根据权利要求7所述的方法,其中,所述主体网络包括多层专家子网络;所述感知模型还包括门控网络,所述门控网络配置在多层专家子网络与所述多任务输出网络之间,用于基于门控网络参数选择至少一个专家子网络的输出数据,传输给所述多任务输出网络中的至少一个子任务分支模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310134421.2/1.html,转载请声明来源钻瓜专利网。