[发明专利]一种进行驾驶策略模型训练的方法与设备有效
申请号: | 201711257831.7 | 申请日: | 2017-12-01 |
公开(公告)号: | CN107862346B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 许稼轩;周小成 | 申请(专利权)人: | 驭势科技(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 上海三和万国知识产权代理事务所(普通合伙) 31230 | 代理人: | 周建华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请的目的是提供一种进行驾驶策略模型训练的方法或设备;获取驾驶设备的驾驶策略模型对应的模型参数信息,其中,所述模型参数信息是基于预定的驾驶规则信息对所述驾驶策略模型进行预训练确定的,所述驾驶策略模型基于强化学习算法建立;获取驾驶设备行驶中的驾驶参数信息,基于所述模型参数信息,对所述驾驶策略模型进行训练。与现有技术相比,本申请对所述驾驶策略模型进行训练并不需要从零开始探索,而是在训练开始之前,所述驾驶设备已经学会了像驾驶规则一样驾驶了,在此基础上进行的驾驶策略模型的训练的过程将大大缩短,并且不合理驾驶策略的次数、训练过程对车辆造成的损伤也将大大减少。 | ||
搜索关键词: | 一种 进行 驾驶 策略 模型 训练 方法 设备 | ||
【主权项】:
一种进行驾驶策略模型训练的方法,其中,所述方法包括:获取驾驶设备的驾驶策略模型对应的模型参数信息,其中,所述模型参数信息是基于预定的驾驶规则信息对所述驾驶策略模型进行预训练确定的,所述驾驶策略模型基于强化学习算法建立;获取驾驶设备行驶中的驾驶参数信息,基于所述模型参数信息,对所述驾驶策略模型进行训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于驭势科技(北京)有限公司,未经驭势科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711257831.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌比对方法及装置
- 下一篇:一种基于随机森林的窃电行为的发现方法