[发明专利]一种基于自适应值迭代核电系统的功率跟踪控制方法在审
申请号: | 202111212919.3 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113868961A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 仲伟峰;王蒙轩;关钧陶 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 值迭代 核电 系统 功率 跟踪 控制 方法 | ||
1.一种基于自适应值迭代的核电系统功率跟踪控制方法,其特征在于,所述方法包括:
S1:初始化参数;
S2:开启全局迭代,根据迭代控制序列更新迭代跟踪过误差值函数,以获得最优跟踪误差值函数;
S3:利用自适应动态规划值迭代算法训练评价网络,修正评价网络的权值;
S4:利用最优跟踪误差值函数得到最优误差控制策略,修正执行网络的权值,更新一次全局迭代成本;
S5:判断当前全局迭代是否满足收敛精度,如果满足收敛精度,根据最优跟踪误差值函数获得最优误差控制策略,若否则返回迭代。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S1中,所述初始化参数包括:核电系统参数、全局训练步长、时间常数、收敛精度以及目标参数;其中,所述核电系统参数为核电的功率模型系统参数,该模型包括五个系统输入输出状态。
3.根据权利要求2所述的方法,其特征在于,设置所述评价网络的结构为5-15-1,并且定义收敛精度为1.0×10-2,其中,5为评价网络的输入节点数量,15为评价网络隐层节点数量,1为评价网络输出层节点数量。设置执行网络的结构为5-5-1,并且定义收敛精度为1.0×10-2,其中,5为评价网络的输入节点数量,5为评价网络隐层节点数量,1为评价网络输出层节点数量。
4.根据权利要求1所述的方法,其特征在于,所述步骤S2还包括:在范围内采用随机方式进行评价网络的权值初始化。
5.根据权利要求1所述的方法,其特征在于,在所述步骤S3中,所述评价网络的输入数据包括核电机组的5个工作状态x(t)与期望功率的工作状态点xd(t)的跟踪误差值xe(t),和核电功率控制棒的跟踪控制策略ue(t);所述评价网络的输出数据包括:跟踪误差值函数Ve(t);
根据Bellman方程,利用所述评价网络下一时刻的输出Ve(t+1)与效用函数U(t),并通过以下公式计算当前时刻的输出数据Ve(t):
其中,xe(t)为核电机组的5个工作状态x(t)与期望功率的工作状态点xd(t)的跟踪误差值xe(t);效用函数U(t)表示t时刻跟踪误差值xe(t)和核电功率控制棒的跟踪控制策略ue(t)的效用总和。
6.根据权利要求5所述的方法,其特征在于,所述效用函数U(t)的计算公式为:
U(t)=α[xe(t)]2+β[ue(t)]2
其中,α与β为常数;ue(t)为核电功率机组在当前时间控制律与期望工作控制律的差值。
7.根据权利要求1所述的方法,其特征在于,在所述步骤S3中,所述评价网络的执行阶段的输入数据包括被控核电机组的相对功率系数、缓发中子相对浓度、反应堆堆芯平均温度、冷却剂的平均温度和控制棒的反应性;所述评价网络的执行阶段的输出数据包括最优跟踪误差值函数,该值函数可以用来得到最优跟踪误差控制策略,其中,所述最优跟踪控制策略由执行网络近似并输出。
8.根据权利要求1所述的方法,其特征在于,在所述步骤S3中,所述评价以及执行网络的更新规则如下:
WCA=-(XTX)-1(XTY)
其中,▽σ为评价-执行网络的权重向量偏差,X为评价网络的权重向量内积差值,Y为评价-执行网络近似的目标近似值,WCA为评价网络的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111212919.3/1.html,转载请声明来源钻瓜专利网。