[发明专利]基于DDPG的线控转向系统转向补偿控制方法及装置有效

申请号：	202110357530.1	申请日：	2021-04-01
公开（公告）号：	CN112977606B	公开（公告）日：	2022-11-11
发明（设计）人：	薛仲瑾;李亮;赵锦涛;黄昌尧;钟志华	申请（专利权）人：	清华大学
主分类号：	B62D5/04	分类号：	B62D5/04;B62D6/00;G06F30/15;G06F30/27;G06N3/04;G06N3/08;B62D113/00
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	欧阳高凤
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ddpg 转向系统补偿控制方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于DDPG的线控转向系统转向补偿控制方法，其特征在于，包括以下步骤：

S1，建立线控转向系统的动作Actor网络和动作价值Critic网络，根据所述动作Actor网络和所述动作价值Critic网络构建深度确定性策略梯度学习算法框架；

S2，设计训练所需的奖励函数；

S3，根据所述奖励函数及所述深度确定性策略梯度学习算法框架建立深度确定性策略梯度算法；

S4，对所述深度确定性策略梯度算法进行硬件在环及实车训练，调整深度确定性策略梯度算法动作Actor网络与动作价值Critic网络的参数，以使所述深度确定性策略梯度算法得到目标转角补偿值。

2.根据权利要求1所述的方法，其特征在于，所述S1进一步包括：

S11，定义状态空间S＝{v_x,w_z,δ,δ_des}和状态向量s_t＝[v_{x_t},w_{z_t},δ_t,δ_t-1,δ_{des_t},δ_{des_t-1}]^T,s_t∈S，其中，v_x为车辆纵向车速，w_z为车辆横摆角速度，δ为实际转角，δ_des为目标转角，t为当前时刻，t-1为上一时刻；

S12，建立所述动作Actor网络a＝μ(s|θ^μ)，其中，μ表示动作Actor网络，状态变量s为网络输入，θ^μ为网络参数，a为网络输出动作；

S13，建立所述动作价值Critic网络Q(s,a|θ^Q)，其中，Q表示动作价值Critic网络，状态变量s以及动作Actor网络的输出动作a为输入，θ^Q为网络参数。

3.根据权利要求2所述的方法，其特征在于，所述奖励函数为：

r＝-w₁|δ_des-δ_a|-w₂(δ_des-δ_a)²-w₃|ΔI_output|

其中，δ_des为目标转角，δ_a为线控转向实际转角，ΔI_output为动作Actor网络的当前输出和上一时刻的输出之间的距离，w_i,i＝1,2,3为各项的权重系数。

4.根据权利要求1所述的方法，其特征在于，所述动作Actor网络和所述动作价值Critic网络为隐层式神经网络。

5.根据权利要求1所述的方法，其特征在于，对所述深度确定性策略梯度算法进行训练，进一步包括：

根据线控转向系统的不同工况下的转向场景，对深度确定性策略梯度算法进行硬件在环训练，硬件在环训练系统包括上位机PC、下位机PXI、线控转向系统ECU以及线控转向台架；训练过程中，DDPG的输出作为目标转角的补偿值，将补偿后的目标转角命令发送给线控转向系统底层控制器，此外，将线控转向台架底层执行的实际的转角发送给上位机，作为车辆运行仿真软件Carsim的输入，DDPG的状态向量s_t＝[v_{x_t},w_{z_t},δ_t,δ_t-1,δ_{des_t},δ_{des_t-1}]^T,s_t∈S通过Carsim输出的车辆状态和系统最初输入的目标转角得到，利用学习算法调整动作Actor网络和动作价值Critic网络的参数。

6.根据权利要求5所述的方法，其特征在于，S4之后还包括：

S5，将硬件在环训练得到的算法先验网络参数作为算法网络参数的初始值应用到实车上，根据车辆运行过程中的即时数据，实时对算法的网络参数进行更新。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110357530.1/1.html，转载请声明来源钻瓜专利网。

上一篇：还原-氧化去除污泥臭味及有害物质的方法及脱臭污泥
下一篇：一种小脚口裤子的设计方法

同类专利

专利分类

B 作业；运输

B62 无轨陆用车辆
B62D 机动车；挂车
B62D5-00 助力的或动力驱动的转向机构
B62D5-02 . 机械的，例如使用功率输出机构提取车辆转轴的动力并将其施加在转向器上
B62D5-04 . 电力的，例如使用伺服电动机与转向器连接或构成转向器的零件
B62D5-06 . 流体的，即利用压力流体作为车辆转向所需要的大部分或全部作用力
B62D5-065 ..以专门适用于根据需要而改变压缩流体供应的装置为特征的，如按要求，可改变助力
B62D5-07 ..用于转向的压力流体动力还供给其他耗能装置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于DDPG的线控转向系统转向补偿控制方法及装置有效

专利文献下载