[发明专利]一种基于A3C算法的混合动力系统能量管理方法在审
申请号: | 202010781714.6 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112084700A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 周健豪;薛源;薛四伍;廖宇晖;刘军 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08;B60W20/00;B60W50/00;G06F111/06 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 a3c 算法 混合 动力 系统 能量 管理 方法 | ||
1.一种基于A3C算法的混合动力系统能量管理方法,其特征在于,包括以下步骤:
步骤1:建立A3C代理模型;
步骤2:设置A3C代理模型的状态、动作和回报,得到设置后的A3C代理模型;
步骤3:获取相关训练数据集,根据获得的相关训练数据集训练所述A3C代理模型得到训练后的A3C代理模型;
步骤4:使用训练后的A3C代理模型进行混合动力车辆的能量管理。
2.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤1中所述A3C代理模型包括:全局神经网络与局部神经网络,所述局部神经网络负责与环境进行交互,并且计算累计损失梯度,并将累计损失梯度传递给全局神经网络,所述全局神经网络负责参数更新,在全局神经网络参数更新完成后,局部神经网络同步全局神经网络的参数。
3.根据权利要求2所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,所述全局神经网络与局部神经网络的神经网络结构一样,都包含Actor网络与Critic网络。
4.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤2中所述状态量为:汽车车速v,汽车加速度a和动力电池SOC,状态变量向量为s={v,a,SOC}T;发动机转矩Te为动作变量,动作变量向量为a={Te}T;奖励函数被用于评价在当前状态st下执行动作at的表现性能,奖励函数定义为成本函数的负值,奖励函数如公式(1)所示:
r=-{fuel(t)+α[SOCref-SOC(t)]2} (1)
其中,fuel(t)为当前时刻下汽车的燃油消耗,SOCref为期望SOC的参考值,SOC(t)为当前时刻电池SOC值,α为电池充电维持的权重。
5.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤3具体包括以下步骤:
步骤A:初始化所述设定后的A3C代理模型得到初始化后的A3C代理模型;
步骤B:将初始化后的A3C代理模型与混的动力汽车进行交互,得到训练数据集;
步骤C:根据所述训练数据集对A3C代理模型进行训练,最终得到训练后的A3C代理模型。
6.根据权利要求5所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤A具体包括:分别初始化所述设定后的A3C代理模型中的全局神经网络参数与局部神经网络参数,其中全局神经网络中的Actor网络与Critic网络参数分别用θ和ω表示;局部神经网络中的Actor网络与Critic网络参数分别用θ′和ω′表示,累计梯度dθ←0和dω←0,最终得到初始化后的A3C代理模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010781714.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于更换蔬菜大棚保温布的装置
- 下一篇:一种公路建设用沙子快速筛选设备