[发明专利]一种驾驶模型训练方法、装置和终端设备有效
申请号: | 201811639549.X | 申请日: | 2018-12-29 |
公开(公告)号: | CN109685214B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 闫泳杉 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 驾驶 模型 训练 方法 装置 终端设备 | ||
本发明实施例提供一种驾驶模型训练方法、装置和终端设备,该方法包括:获取基础驾驶模型,其中,所述基础驾驶模型为使用第一场景的样本数据进行训练得到的驾驶模型;使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在所述第二场景进行驾驶的目标驾驶模型。本发明实施例可以加快目标驾驶模型的收敛速度。
技术领域
本发明涉及自动驾驶技术领域,尤其涉及一种驾驶模型训练方法、装置和终端设备。
背景技术
随着深度学习技术的迅速发展,以及人工智能的深入研究,目前车辆从人工驾驶向自动驾驶的趋势进行变化。其中,通过模型实现自动驾驶是目前自动驾驶领域的一个主要研究方向。目前车辆中往往会有多个模型,例如:不同驾驶场景对应不同的模型,或者,不同控制指令对应不同的模型等等。且目前模型训练都是采用模型对应的样本数据进行训练,例如:第一场景的模型使用第一场景的样本数据进行训练,第二场景的模型使用第二场景的样本数据进行训练。然而,这种模型训练方式的模型收敛速度比较慢。
发明内容
本发明实施例提供一种驾驶模型训练方法、装置和终端设备,以解决模型收敛速度比较慢的问题。
本发明实施例提供一种驾驶模型训练方法,包括:
获取基础驾驶模型,其中,所述基础驾驶模型为使用第一场景的样本数据进行训练得到的驾驶模型;
使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在所述第二场景进行驾驶的目标驾驶模型。
可选的,所述使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在第二场景进行驾驶的目标驾驶模型之前,所述方法还包括:
将预设学习率调低,以得到用于所述目标驾驶模型训练的目标学习率,其中,所述预设学习率为所述基础驾驶模型训练过程中使用的学习率或者通用学习率;
所述使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在第二场景进行驾驶的目标驾驶模型,包括:
按照所述目标学习率,使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在第二场景进行驾驶的目标驾驶模型。
可选的,所述基础驾驶模型包括多个卷积块,所述第一场景和所述第二场景存在共同道路特征,所述使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在第二场景进行驾驶的目标驾驶模型,包括:
使用第二场景的样本数据对所述基础驾驶模型进行多次微调,其中,每次微调时冻结所述基础驾驶模型的部分卷积块,直到所述基础驾驶模型的损失值低于特定门限值的,以获得用于在所述第二场景进行驾驶的目标驾驶模型。
可选的,所述多次微调中每次微调所冻结的卷积块数量不同;或者,
所述多次微调中存在所冻结的卷积块数量相同,但存在不同的卷积块的至少两次微调。
可选的,所述第一场景为开放道路,所述第二场景为园区。
本发明实施例还提供一种驾驶模型训练装置,包括:
获取模块,用于获取基础驾驶模型,其中,所述基础驾驶模型为使用第一场景的样本数据进行训练得到的驾驶模型;
训练模块,用于使用第二场景的样本数据对所述基础驾驶模型进行训练,以得到用于在所述第二场景进行驾驶的目标驾驶模型。
可选的,所述装置还包括:
调整模块,用于将预设学习率调低,以得到用于所述目标驾驶模型训练的目标学习率,其中,所述预设学习率为所述基础驾驶模型训练过程中使用的学习率或者通用学习率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811639549.X/2.html,转载请声明来源钻瓜专利网。