[发明专利]一种电力现货日前市场辅助报价方法在审
申请号: | 202110902686.3 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113610599A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 李沛东;彭舰;黄飞虎;弋沛玉;王金策;李梦诗 | 申请(专利权)人: | 四川大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q50/06 |
代理公司: | 成都玖和知识产权代理事务所(普通合伙) 51238 | 代理人: | 胡琳梅 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 现货 日前 市场 辅助 报价 方法 | ||
1.一种电力现货日前市场辅助报价方法,其特征在于,包括步骤:
步骤S1.将各发电商的报价行为作为动作a;将各发电商的中标情况作为状态s;将发电商报价后可获得的收益作为回报r;将市场出清结果作为交互过程中的环境;将发电商在中标后可以采取的报价动作作为策略π;
步骤S2.初始化下列参数:状态-行为值函数Qi(s,ai)=0;策略πi(s,ai)=1/|Ai|;平均策略其中,i为发电商编号;A为所有动作a的集合;
步骤S3.各发电商根据状态s利用探索-利用策略得出报价动作ai并提交给市场;
步骤S4.所有发电商均完成动作提交后,市场进行出清,并将各发电商的收益ri和下一状态的中标状态s’反馈给各发电商;
步骤S5.更新所有发电商的值函数Qi(s,ai);
步骤S6.根据更新后的值函数Qi(s,ai),对每一个ai∈Ai,更新平均估计策略πi(s,ai)和策略πi(s,ai);
步骤S7.重复步骤S3-S6以完成辅助报价模型的训练。
2.如权利要求1所述的电力现货日前市场辅助报价方法,其特征在于,步骤S4中各发电商的收益ri的计算方法为:
ri=piPi-Fcoal;
Fcoal=a2pi2+a1pi+a0;
其中,pi为发电商的中标电量,Pi为中标电价,a2,a1和a0为独立的成本系数。
3.如权利要求1所述的电力现货日前市场辅助报价方法,其特征在于,步骤S5中更新所有发电商的值函数Qi(s,ai)的方法为:
分别构建当前值网络和目标值网络,每个网络均包含两层拥有256个神经单元的隐藏层,两个的网络的输入为当前状态下的所有动作向量,输出为当前状态下各动作对应的价值函数向量;
将当前值网络参数θ和目标值网络参数θ-均初始化为x(x∈(0,0.5));
设定用于存储根据所述步骤S4结果得到的(s,ai,ri,s’)的经验回放集合,并初始化其大小为2000;(s,ai,ri,s’)表示在状态s下采取动作ai能够达到状态s’并获得奖励ri;
从所述经验回放集合中随机采样(st,at,rt+1,st+1)来计算当前值网络的损失函数值。
4.如权利要求3所述的电力现货日前市场辅助报价方法,其特征在于,还包括步骤:
所述当前值网络的损失函数值的计算方法为:
其中,为目标值网络输出的St+1状态下的动作价值函数,Q(St,a;θ)为当前值网络输出的St状态下的动作价值函数;
采用梯度下降法更新当前值网络参数θ,并每隔C轮将θ的值赋给目标值网络参数其中,(C∈(10,100)。
5.如权利要求1所述的电力现货日前市场辅助报价方法,其特征在于,步骤S6中所述平均估计策略的更新方法为:
C(s)=C(s)+1,
其中,C(s)为状态s出现的次数,其初始值为0。
6.如权利要求1所述的电力现货日前市场辅助报价方法,其特征在于,步骤S6中策略πi(s,ai)的更新方法为:
πi(s,ai)←πi(s,ai)+Δsa
其中
,其中
其中,δl,δw均为可变学习速率,δl,δw∈(0,1),且δlδw。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110902686.3/1.html,转载请声明来源钻瓜专利网。