[发明专利]自动泊车方法、装置、计算机设备和存储介质有效
申请号: | 201911317486.0 | 申请日: | 2019-12-19 |
公开(公告)号: | CN111126598B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 莫松文;任仲超;凌云志;张业楚 | 申请(专利权)人: | 深圳南方德尔汽车电子有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/0464;G06Q10/04;B60W30/06 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 罗瑞锋 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 泊车 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了本发明提供了一种自动泊车方法、装置、计算机设备和存储介质,方法包括以下步骤:获取用户所需泊车车位坐标和车辆当前所在空间坐标,以得到用户需求信息数据;将用户需求信息数据带入预先根据duel_dqn强化学习算法训练的模型得到最佳泊车线路模型;根据最佳泊车线路模型,输出对应的车辆方向盘角度和油门值。与现有技术相比,本发明的实施例提供了一种自动泊车方法、装置、计算机设备和存储介质,其采用强化学习duel_dqn算法实现自动泊车,从而无需中间路径规划,减少了工作量,解决了问题诊断的难题。
技术领域
本发明涉及自动泊车算法技术领域,尤其涉及一种基于强化学习算法的自动泊车方法、装置、计算机设备和存储介质。
背景技术
目前市面的泊车系统都是基于传感器获取的障碍物数据和车位数据,然后送往下游规划控制模块,具体流程如下描述:
通过camera或者lidar(激光雷达)获取障碍物的位置(obstacle_position)和车位(parking_position)的位置,映射到一张全局地图,然后标记处自己车身的位置(ego_position);通过航迹推算的方式获取车的实时位态(localization);基于ego_position和parking_position进行路径规划(planning)输出path;获取path设计控制器(controller)进行follow;输出方向盘的转向角和油门值。
发明内容
本发明的实施例提供了一种自动泊车方法、装置、计算机设备和存储介质,旨在解决现有自动泊车方法效率低、耗时间、故障诊断困难的问题。
为达到上述目的,本发明所提出的技术方案为:
第一方面,本发明提供了一种自动泊车方法,其包括以下步骤:
获取用户所需泊车车位坐标和车辆当前所在空间坐标,以得到用户需求信息数据;
将用户需求信息数据带入预先根据duel_dqn强化学习算法训练的模型得到最佳泊车线路模型;
根据最佳泊车线路模型,输出对应的车辆方向盘角度和油门值。
其中,所述步骤“将用户需求信息数据带入预先根据duel_dqn强化学习算法训练的模型得到最佳泊车线路模型”包括:
设定泊车终点位置信息、车辆当前所在位置信息,以及泊车所需经过的全部障碍位置信息;
将不同的方向盘角度和油门值输入至值函数网络,以得到loss函数;
根据loss函数,调整值函数网络的参数,以得到最佳值函数网络;
根据最佳值函数网络,搭建两层神经连接层拟合得到最佳泊车线路模型。
其中,所述步骤“将不同的方向盘角度和油门值输入至值函数网络,以得到loss函数”中获取loss函数采用TD_error算法。
其中,所述步骤“将用户需求信息数据带入预先根据duel_dqn强化学习算法训练的模型得到最佳泊车线路模型”中,duel_dqn强化学习算法的reward值设定为:若车辆发生碰撞则reward值为-2,若车辆到达指定目的地则reward值为1,其他reward值为0。
第二方面,本发明提供了一种自动泊车装置,其包括:
信息获取单元,用于获取用户所需泊车车位坐标和车辆当前所在空间坐标,以得到用户需求信息数据;
模型训练单元,将用户需求信息数据带入预先根据duel_dqn强化学习算法训练的模型得到最佳泊车线路模型;
信息输出单元,根据最佳泊车线路模型,输出对应的车辆方向盘角度和油门值。
其中,所述模型训练单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳南方德尔汽车电子有限公司,未经深圳南方德尔汽车电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911317486.0/2.html,转载请声明来源钻瓜专利网。