[发明专利]一种自动驾驶感知模型的训练方法、装置、设备和介质有效
申请号: | 202310134421.2 | 申请日: | 2023-02-10 |
公开(公告)号: | CN115879535B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 张伟;谭啸;林相如;叶晓青;韩钧宇;王井东;丁二锐;吴甜;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/0895 | 分类号: | G06N3/0895;G06N3/084;G06N3/096;G06N3/0464;G06F18/25 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 蔡舒野 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 驾驶 感知 模型 训练 方法 装置 设备 介质 | ||
本公开提供了一种自动驾驶感知模型的训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、智慧城市等场景。该训练方法包括:获取一种或多种模态的训练样本;采用设定场景的有标注数据对感知模型进行场景化训练;采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。本公开提供的方案充分发挥了自动驾驶场景海量数据和大模型的优势。
技术领域
本公开涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、智慧城市等场景。
背景技术
在自动驾驶车辆中,感知系统是最为重要的组成部分,其作用是帮助自动驾驶车辆理解周边的环境。
现有的自动驾驶感知模型,其生产方式是基于少量训练数据,对小模型进行训练的传统模式。这无法发挥自动驾驶场景海量数据样本的优势。在数据方面,现有人工标注方法效率低、价格高、周期长,因此,也难以将海量数据标注为样本数据,满足模型训练的数据建设需求。
发明内容
本公开提供了一种自动驾驶感知模型的训练方法、装置、设备和介质。
根据本公开的一方面,提供了一种自动驾驶感知模型的训练方法,包括:
获取一种或多种模态的训练样本;其中,所述训练样本包括有标注数据和无标注数据;
采用设定场景的有标注数据对感知模型进行场景化训练;
采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;
采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。
根据本公开的另一方面,提供了一种自动驾驶感知模型的训练装置,包括:
训练样本获取模块,用于获取一种或多种模态的训练样本;其中,所述训练样本包括有标注数据和无标注数据;
场景化训练模块,用于采用设定场景的有标注数据对感知模型进行场景化训练;
半监督训练模块,用于采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;
知识迁移模块,用于采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所提供的自动驾驶感知模型的训练方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所提供的自动驾驶感知模型的训练方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令在被处理器执行时实现本公开任一实施例所提供的自动驾驶感知模型的训练方法。
本公开实施例提供了一种自动驾驶感知模型训练的完整方案,能够充分发挥自动驾驶海量无标注数据的作用,以及大规模感知模型的强大特征提取和表达能力,兼顾小规模车端模型的性能和训练效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310134421.2/2.html,转载请声明来源钻瓜专利网。