[发明专利]一种基于分层深度强化学习的电动汽车充电引导策略方法在审
申请号: | 202111414488.9 | 申请日: | 2021-11-25 |
公开(公告)号: | CN114117910A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 詹华;江昌旭 | 申请(专利权)人: | 福建船政交通职业学院 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N7/00;G06F111/06 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 350007 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 深度 强化 学习 电动汽车 充电 引导 策略 方法 | ||
1.一种基于分层深度强化学习的电动汽车充电引导策略方法,其特征在于,包括以下步骤:
S1、构建考虑多种不确定因素的电动汽车充电引导两层随机优化模型;
S2、将该两层随机优化模型转换为未知转移概率的马尔科夫决策过程;
S3、在给定马尔科夫决策过程基础上提出一种改进的分层深度强化学习算法,并对其进行训练,得到最终的电动汽车充电引导策略;其中,改进的分层深度强化学习算法包含两层强化学习,上层强化学习用于对电动汽车充电引导目的地的优化,在此基础上,下层强化学习用于对电动汽车充电引导路径的优化。
2.根据权利要求1所述的一种基于分层深度强化学习的电动汽车充电引导策略方法,其特征在于,所述步骤S1包括以下步骤:
S101、建立考虑多种不确定因素的电动汽车充电引导随机优化模型
电动汽车充电引导策略目标为最小化电动汽车充电总费用,该费用包括前往充电站的旅途费用和充电站中充电费用两部分,表达如下数学模型:
s.t.
k∈D,L∈Ω (8)
式中,表示电动汽车前往充电站k通过路径L的旅途费用;表示电动汽车在充电站k充电时的费用;l∈L表示充电路径上的一段道路;表示电动汽车前往充电站k通过道路l的花费的电量费用;表示电动汽车前往充电站k通过道路l所需的时间;β表示单位时间成本;表示电动汽车在充电站k时充电的电量费用;表示电动汽车在充电站k时的充电等待时间,本模型中其表示为随机变量;表示平均电价;α表示单位距离平均耗电量,本模型中其表示为随机变量;dk,l和vk,l表示电动汽车前往充电站k时道路l的距离和行驶速度;表示充电站k的实时电价;SOCdecide和分别表示电动汽车决策时和到达充电站k时的剩余电量;Emax表示电池的容量;λ表示单位距离的平均耗电量,即λ=α/Emax;D和Ω表示充电站集合和前往充电站所有路径集合;
以上数学模型,式(1)表示充电引导的目标函数,即最小化电动汽车前往充电站的旅途费用和充电费用;式(2)表示电动汽车旅途费用,由两部分组成:一是在路径L上消耗电量的费用即式(4)所示,二是通过路径L所需要的时间费用即式(5)所示;式(3)表示电动汽车充电费用,由两部分组成:一是在充电站k时充电电量费用即式(6)所示,二是充电等待时间的成本;式(7)表示电动汽车剩余电量SOC变化情况;
S102、建立考虑多种不确定因素的电动汽车充电引导两层随机优化模型
从步骤S101中能够得出,电动汽车充电引导模型其实能够划分为两层随机优化,即当电动汽车由于电量低需要进行充电时,电动汽车用户首先需要根据当前的车况、交通和充电站状态选定某个目标充电站;然后,在充电目的地已经明确的前提下,寻找一条最优的行驶路线,使得电动汽车尽快到达充电目的地,同时期望充电时的花费尽可能小;建立考虑多种不确定因素的电动汽车充电引导两层随机优化模型如下:
s.t.
k∈D,L∈Ω (15)
式中,表示电动汽车前往充电站k时选择路径L的最小花费;
上层目标为式(9)所示,其表示电动汽车选择充电站k以使得电动汽车在充电站中的费用和式(10)表示的下层充电旅途费用之和最小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建船政交通职业学院,未经福建船政交通职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111414488.9/1.html,转载请声明来源钻瓜专利网。