[发明专利]一种基于A3C算法的混合动力系统能量管理方法在审

专利信息
申请号: 202010781714.6 申请日: 2020-08-06
公开(公告)号: CN112084700A 公开(公告)日: 2020-12-15
发明(设计)人: 周健豪;薛源;薛四伍;廖宇晖;刘军 申请(专利权)人: 南京航空航天大学
主分类号: G06F30/27 分类号: G06F30/27;G06N3/04;G06N3/08;B60W20/00;B60W50/00;G06F111/06
代理公司: 江苏圣典律师事务所 32237 代理人: 贺翔
地址: 210016 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 a3c 算法 混合 动力 系统 能量 管理 方法
【权利要求书】:

1.一种基于A3C算法的混合动力系统能量管理方法,其特征在于,包括以下步骤:

步骤1:建立A3C代理模型;

步骤2:设置A3C代理模型的状态、动作和回报,得到设置后的A3C代理模型;

步骤3:获取相关训练数据集,根据获得的相关训练数据集训练所述A3C代理模型得到训练后的A3C代理模型;

步骤4:使用训练后的A3C代理模型进行混合动力车辆的能量管理。

2.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤1中所述A3C代理模型包括:全局神经网络与局部神经网络,所述局部神经网络负责与环境进行交互,并且计算累计损失梯度,并将累计损失梯度传递给全局神经网络,所述全局神经网络负责参数更新,在全局神经网络参数更新完成后,局部神经网络同步全局神经网络的参数。

3.根据权利要求2所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,所述全局神经网络与局部神经网络的神经网络结构一样,都包含Actor网络与Critic网络。

4.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤2中所述状态量为:汽车车速v,汽车加速度a和动力电池SOC,状态变量向量为s={v,a,SOC}T;发动机转矩Te为动作变量,动作变量向量为a={Te}T;奖励函数被用于评价在当前状态st下执行动作at的表现性能,奖励函数定义为成本函数的负值,奖励函数如公式(1)所示:

r=-{fuel(t)+α[SOCref-SOC(t)]2} (1)

其中,fuel(t)为当前时刻下汽车的燃油消耗,SOCref为期望SOC的参考值,SOC(t)为当前时刻电池SOC值,α为电池充电维持的权重。

5.根据权利要求1所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤3具体包括以下步骤:

步骤A:初始化所述设定后的A3C代理模型得到初始化后的A3C代理模型;

步骤B:将初始化后的A3C代理模型与混的动力汽车进行交互,得到训练数据集;

步骤C:根据所述训练数据集对A3C代理模型进行训练,最终得到训练后的A3C代理模型。

6.根据权利要求5所述的基于A3C算法的混合动力系统能量管理方法,其特征在于,步骤A具体包括:分别初始化所述设定后的A3C代理模型中的全局神经网络参数与局部神经网络参数,其中全局神经网络中的Actor网络与Critic网络参数分别用θ和ω表示;局部神经网络中的Actor网络与Critic网络参数分别用θ′和ω′表示,累计梯度dθ←0和dω←0,最终得到初始化后的A3C代理模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010781714.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top