[发明专利]基于强化学习型的方法及系统有效
申请号: | 201811586865.5 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109871010B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 黄骏;史玉回;张大步 | 申请(专利权)人: | 南方科技大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02;G05D1/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 唐致明;洪铭福 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习型的方法及系统,通过获取车辆驾驶行为数据及车辆当前位置信息,基于预学习驾驶轨迹数据,调整车辆自动驾驶行为,实现车辆的自动控制,通过对驾驶行为进行精准聚类,提高车辆自动驾驶执行精度,提高自动驾驶事故应急管理,有效减少事故的发生。另外,通过将驾驶行为数据实时发送至远程控制端,当车辆驾驶处于失配状态时,接收远程控制端调整车辆驾驶行为指令,使远程控制人员可以在车辆遇到紧急情况时远程遥控车辆驾驶行为,使车辆自动驾驶更加安全可靠。本发明涉及机械电子与人工智能技术领域。 | ||
搜索关键词: | 基于 强化 学习 方法 系统 | ||
【主权项】:
1.一种基于强化学习型的方法,其特征在于,所述方法包括:获取车辆在行驶过程中的批量训练数据,生成预学习驾驶轨迹数据,并存储在数据库中,所述驾驶轨迹数据包括驾驶行为数据和相应的线路数据;获取车辆当前驾驶行为数据,基于复分数模型对驾驶行为数据进行处理,根据驾驶行为数据处理结果以确定是否锁定当前驾驶参数;获取车辆当前位置与环境信息,基于预学习驾驶轨迹数据,根据驾驶行为数据,调整车辆自动驾驶行为;将获取的驾驶行为数据输入深度Q网络模块和学习损失函数模块,对获取的驾驶行为数据进行按复分数模型计算并记分聚类存储,更新数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811586865.5/,转载请声明来源钻瓜专利网。