[发明专利]一种基于强化学习的现货市场售电商报价方法在审
申请号: | 202210274106.5 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114897552A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 刘秋华;方正聪;何晓敏 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/04;G06Q50/06;G06N20/00 |
代理公司: | 南京睿之博知识产权代理有限公司 32296 | 代理人: | 刘菊兰 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 现货 市场 商报 方法 | ||
1.一种基于强化学习的现货市场售电商报价方法,其特征在于,包括以下步骤:
S1、设定现货市场交易规则:采用购售电双方双边集中竞价方式进行市场交易,通过分时段阶梯报价方式,并采用统一边际出清方式出清结算;
S2、建立售电商收益模型,给出不同类型售电商报价策略的目标模型,并对模型进行假设条件和初值设定;
S3、根据步骤S2建立的不同售电商的收益模型及目标模型,引入强化学习算法,并根据强化学习算法对模型中所有售电商的状态空间、动作空间、奖赏函数进行定义,建立基于强化学习的现货市场售电商报价模型;
S4、对步骤S3中建立的基于强化学习的现货市场售电商报价模型采用ε-贪心算法进行求解,结合市场出清电价和各售电商下一小时负荷水平,得到各售电商利润和出清电量。
2.根据权利要求1所述的一种基于强化学习的现货市场售电商报价方法,其特征在于:所述步骤S2中售电商收益模型包括:
R=QBiddingP-QBiddingPAhead-QC(PC-PAhead)
其中,R表示售电商的利润;QBidding表示日前市场售电商的中标电量;P表示售电商单位售电价格;PAhead表示日前市场的出清电价;QC表示售电商的中长期差价合约锁定电量;PC表示售电商的中长期差价合约电价。
3.根据权利要求1所述的一种基于强化学习的现货市场售电商报价方法,其特征在于:所述步骤S2中不同类型售电商报价策略的目标模型包括:
中间商分成型的售电商目标模型为:
G1=max{η[QSPS-QSPclear-QC(PC-Pclear)]}
其中,PS为售电商与用户签订的售电合同价格,QS为成交的电量,QC为中长期差价合约锁定的电量,PC为中长期差价合约电价,Pclear为市场出清电价,η为售电商与电力用户的分成比例;
扩张型售电商的售电商目标模型为:
G2=maxQBuy
其中,QBuy为售电商日前市场的竞价电量。
4.根据权利要求1所述的一种基于强化学习的现货市场售电商报价方法,其特征在于:所述步骤S3中强化学习算法的Q值的更新规则为:
其中,s为状态,t为动作,β为控制学习速度的动态学习率;表示智能体对实际Q函数的估计,γ表示奖赏折扣系数,表示期望最优策略的Q值;即智能体采用新状态s′当前的值来精化其对前一状态s的估计值
5.根据权利要求4所述的一种基于强化学习的现货市场售电商报价方法,其特征在于:所述动态学习率β的更新规则为:
其中,Tn(s,a)为状态-动作对在这n次循环内被访问的总次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210274106.5/1.html,转载请声明来源钻瓜专利网。