[发明专利]一种基于蒙特卡洛方法的电动车智能充电优化方法和系统有效
申请号: | 202011286676.3 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112428834B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 陈征 | 申请(专利权)人: | 宁波工程学院 |
主分类号: | B60L53/00 | 分类号: | B60L53/00;G06F17/15 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 蒙特卡洛 方法 电动车 智能 充电 优化 系统 | ||
1.一种基于蒙特卡洛方法的电动车智能充电优化方法,其特征在于,包括以下步骤:
S1对所有的电动车充电状况s设置一任意策略π(s);
S2将开始时刻的状态s0和行动a0带入初始化策略π0(s)获得序列:s0,a0,R1,…,sT-1,aT-1,RT,Ri为i时刻能量的即时消耗;
S3根据S2中的所述序列获得i时刻状况si和行动ai对应的G值;
S4若状态st和行动at在所述序列中出现过,则记录其G值中,遍历所有待测状态和行动,获得所有在所述序列中出现过的状态和行动对应的G值;
S5将所有的G值取平均值获得行动值函数值Q(s,a);
S6重复步骤S1-S5,选取不同的策略π(s)并获得与其对应的行动值函数值Q(s,a);其中行动值函数值Q(s,a)最大时对应的策略π(s)为最优策略。
2.如权利要求1所述的基于蒙特卡洛方法的电动车智能充电优化方法,其特征在于,所述步骤S2中能量的即时消耗的公式为:
其中,Ech(SoC(t))表示[t,t+1]时间段内的充电桩充给电动车的电能,η是充电效率系数,g表示当能耗超过电池可用电能时候的油耗。
3.如权利要求2所述的基于蒙特卡洛方法的电动车智能充电优化方法,其特征在于,所述步骤S3中G值的计算公式:
Gt=γGt-1+Rt+1
其中,γ为折扣因子,为常数,G0=0。
4.如权利要求3所述的基于蒙特卡洛方法的电动车智能充电优化方法,其特征在于,所述步骤S5中行动值函数值Q(s,a)的计算公式:
其中,T为时间段[0,M]插入的T个等分点,Eπ[]为采用策略π在时间段[0,M]中消耗的电能。
5.如权利要求4所述的基于蒙特卡洛方法的电动车智能充电优化方法,其特征在于,所述步骤S6中获得的最优策略带入下式得到最优能耗:
其中,b(t)是Boolean值函数,当汽车在充电站时等于1,不在充电站时等于0;k表示汽油能量转化为电能的适当系数;Et表示[t,t+1]时间段内消耗的电能;En表示车辆电池的名义容量。
6.一种基于蒙特卡洛方法的电动车智能充电优化系统,其特征在于,包括:
策略设定模块,用于对所有的电动车充电状况s设置一任意策略π(s);
序列模块,用于将开始时刻的状态s0和行动a0带入初始化策略π0(s)获得序列:s0,a0,R1,…,sT-1,aT-1,RT,Ri为i时刻能量的即时消耗;
G值模块,用于根据S3中的所述序列获得i时刻状况si和行动ai对应的G值;
记录模块,用于若状态st和行动at在所述序列中出现过,则记录其G值中,遍历所有待测状态和行动,获得所有在所述序列中出现过的状态和行动对应的G值;
行动值函数值计算模块,用于将所有的G值取平均值获得行动值函数值Q(s,a);
循环输出模块,选取不同的策略π(s)并获得与其对应的行动值函数值Q(s,a);其中行动值函数值Q(s,a)最大时对应的策略π(s)为最优策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波工程学院,未经宁波工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011286676.3/1.html,转载请声明来源钻瓜专利网。