[发明专利]基于MPC和Q-Learning算法的混合动力汽车分层控制方法在审
申请号: | 202210376158.3 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114987433A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 尹燕莉;黄学江;张鑫新;王福振 | 申请(专利权)人: | 重庆交通大学 |
主分类号: | B60W20/00 | 分类号: | B60W20/00;B60W40/00;B60W40/10;G06F17/16 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 胡博文 |
地址: | 402247 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mpc learning 算法 混合 动力 汽车 分层 控制 方法 | ||
1.一种基于MPC和Q-Learning算法的混合动力汽车分层控制方法,其特征在于:包括以下步骤:
S1.采集行车队列参数以及行车队列中第i辆车的车辆参数;其中:行车队列参数包括第i辆车的前车位置信息和前车速度信息;第i辆车的车辆参数包括车速和加速度;
S2.构建MPC预测控制模型,并根据行车队列参数和自身车辆参数确定出第i辆车的期望加速度;
S3.根据第i辆车的期望加速度确定出第i辆车的期望速度;
S4.构建Q-Learning网络,将第i辆车的期望速度、需求功率以及电池电量状态输入Q-Learning网络中进行处理,输出第i辆车的电机的最优转矩,并基于最优转矩控制混合动力汽车工作。
2.根据权利要求1所述基于MPC和Q-Learning算法的混合动力汽车分层控制方法,其特征在于:步骤S2中具体包括:
S21.构建第i辆车的状态变量x和动作变量u,其中:
x=[es ev ai vi]T,u=ades,es为第i辆车与前车的车间距误差,ev为第i辆车与前车的速度误差,ai为第i辆车的加速度,vi为第i辆车的速度,ades为第i辆车的期望加速度;
S22.根据步骤S1确定的状态变量和动作变量建立第i辆车的状态方程:
其中,A和B为系数矩阵,且:
th为第i辆车与前车的车头时距,τ表示车辆动力部件的时间常数;
S23.采用前向欧拉法对步骤S2中的状态方程进行离散处理,得到离散状态方程:
其中,k为当前采样时刻,k+1位下一采样时刻,Ts为采样周期;
令状态向量ξ(k|k)=[x(k|k) u(k-1)]T,将公式(2)转换为:
其中,Im为单位矩阵,m=4,n=1,且:u(k+i)=u(k+i-1)+△u(k);
S24.基于公式(3)建立MPC预测输出状态方程:
Y(k)=Φξ(k|k)+Θ△U (4);
△U=[△u(k) △u(k+1) … △u(k+Nc)]T (5)
其中:Nc为控制时域,Np为预测时域且Nc≤Np;
S25.构建性能指标函数为:
其中,yref(k+i|k)为k时刻的k+i步的参考输出,Q为误差加权矩阵,R为输入加权矩阵,yp(k+i|k)表示k时刻第k+i步的预测输出;
将公式(4)代入至公式(6)中后化简得到:
H(k)=ΘTQΘ+R,f=ΘTQ(Φξ(k)-Yref(k));
S26.基于公式(7)构建如下方程:
采用MATLAB软件中的二次规划求解器对公式(8)进行求解,得到最优可行解:
其中,公式(9)中的各项即为第i辆车的各个时刻的期望加速度,并将其中第一项u*(k)输入至Q-Learning网络中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆交通大学,未经重庆交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210376158.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:拍频信号处理方法及装置
- 下一篇:一种基础设施数据管理装置