[发明专利]基于深度强化学习的混动列车的能量管理方法及系统有效
申请号: | 202010989685.2 | 申请日: | 2020-09-18 |
公开(公告)号: | CN112116156B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 彭勇;伍元凯;范超杰;张洪浩 | 申请(专利权)人: | 中南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06F30/15;G06F30/27;G06N3/04;B61L27/00;G06F119/14 |
代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 何湘玲 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 列车 能量 管理 方法 系统 | ||
1.一种基于深度强化学习的混动列车的能量管理方法,其特征在于,包括以下步骤:
获取混动列车的列车运行速度、列车运行环境、列车运行能耗信息和列车运行动力总成信息的历史数据,作为源数据;
从源数据中提取速度、加速度、电池电量以及列车的位置作为输入,以能量管理策略作为输出,建立能量管理策略模型;所述列车位置包括:到站点距离以及列车在轨道上的位置;
建立列车动力仿真模型,将所述能量管理策略模型输出的能量管理策略输入至所述列车动力仿真模型,获得所述列车动力仿真模型在所述能量管理策略下的仿真运行状态,根据所述仿真运行状态以及奖励函数获得对应的奖励参数;以所述奖励参数作为反馈数据对所述能量管理策略模型进行优化;所述列车动力仿真模型包括:动力学模型、动力源模型以及电池模型,所述仿真运行状态包括列车运行能耗信息、发动机启停状态以及电池组的温度;所述动力源模型为按照列车的不同能量源的功率和连接结构建立的动力学分配模型;
所述动力学模型为列车纵向运动动力学模型,方程如下:
其中,M为列车质量,V为列车纵向速度,∑Fl为列车的总牵引力,∑fl为列车的总阻力,γ为列车的回转质量系数;所述总阻力包括:摩擦阻力,运行阻力和空气阻力之和;所述运行阻力包括列车经过弯道时的弯道阻力以及列车经过隧道时的隧道阻力;
通过深度强化学习进行离线训练,迭代至收敛,得到优化后的能量管理策略模型;
以混动列车的实时的速度、加速度以及电池电量输入所述优化后的能量管理策略模型,获得优化的能量管理策略;所述能量管理策略包括发动机的转速和转矩。
2.根据权利要求1所述的基于深度强化学习的混动列车的能量管理方法,其特征在于,所述动力源模型为:
Teng=Tisg,Tmot=Taxle
Weng=Wisg,Wmot=Waxle
Teng,Tisg,Tmot和Taxle分别为发动机、发电机、驱动电机和轴的转矩,而Weng,Wisg,Wmot和Waxle分别为发动机、发电机、驱动电机和轴的转速;Taxle和Waxle通过列车运行速度和动力学模型仿真获得。
3.根据权利要求1至2中任一项所述的基于深度强化学习的混动列车的能量管理方法,其特征在于,所述深度强化学习采用包括表演者网络和评论家网络的深度神经网络结构进行训练;所述表演者网络用于根据输入的速度、加速度以及电池电量,拟合输出能量管理策略;所述评论家网络用于通过奖励参数优化能量管理策略的收益;
所述表演者网络和评论家网络均包括:输入层、N个全连接神经网络层、以及输出层。
4.根据权利要求3所述的基于深度强化学习的混动列车的能量管理方法,其特征在于,所述全连接神经网络层采用线性整流函数作为激活函数;所述表演者网络的输出层采用linear激活函数;所述评论家网络的输出层采用sigmoid激活函数。
5.根据权利要求3所述的基于深度强化学习的混动列车的能量管理方法,其特征在于,所述奖励函数为
其中,RMB(E+Fuel)为电耗和油耗的人民币价格,表示列车的瞬时能耗;i(engine)表示发动机在某一时刻是否启动,如果发动机启动i(engine)=-1,如果发动机不启动i(engine)=0;-temperature表示电池组的温度奖励函数;w1,w2和w3是对应的加权参数。
6.一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5中任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010989685.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理