[发明专利]SISO紧格式无模型控制器基于集成学习的参数自整定方法有效

申请号：	202010559963.0	申请日：	2020-06-18
公开（公告）号：	CN112015083B	公开（公告）日：	2021-09-24
发明（设计）人：	卢建刚;杨晔;陈晨;陈金水;王文海	申请（专利权）人：	浙江大学;之江实验室
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	浙江杭州金通专利事务所有限公司 33100	代理人：	刘晓春
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	siso 格式模型控制器基于集成学习参数方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于包括以下步骤：

步骤(1)：SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ；确定SISO紧格式无模型控制器待整定参数，所述SISO紧格式无模型控制器待整定参数，为所述SISO紧格式无模型控制器参数的部分或全部，包含惩罚因子λ和步长因子ρ的任意之一或其组合；确定集成学习算法中个体算法的数目为3；确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络；确定PSO算法的迭代次数、种群规模；初始化PSO算法中粒子群的位置与速度；确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化BP神经网络隐含层和输出层中所有待训练学习的权系数；确定BP神经网络反向传播的学习率参数值；确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化循环神经网络隐含层和输出层中所有待训练学习的权系数；确定循环神经网络反向传播的学习率参数值；

步骤(2)：将当前时刻记为k时刻，基于系统输出期望值与系统输出实际值，采用系统误差计算函数计算得到k时刻的系统误差，记为e(k)；

步骤(3)：将步骤(2)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合，作为系统误差集合，所述的系统误差集合作为集成学习算法的输入集合；

步骤(4)：基于步骤(3)所述的集成学习算法的输入集合，步骤(1)中所述的集成学习算法中的个体算法进行并行运算，各自运算方法如下：

当所述个体算法为PSO算法时，PSO算法粒子群规模为待整定参数的数目，初始化PSO算法中的所有粒子的位置，计算粒子群中每一个粒子的适应度值，通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置，基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新，更新公式如下：

V(i)＝wV(i)+c₁r₁(gbest(i)-pop(i))+c₂r₂(zbest-pop(i))

pop(i)＝pop(i)+wV(i)

其中V(i)是待更新的粒子个体速度，pop(i)是待更新的粒子个体位置，zbest是当前群体最优粒子，gbest是当前个体最优粒子，c₁和c₂是非负的常数，r₁和r₂是分布于0到1之间的随机数，w是惯性权重系数；最终输出的群体最优粒子作为所述SISO紧格式无模型控制器待整定参数的值λ₁和/或ρ₁，记为候选参数集合1；

当所述个体算法为BP神经网络时，基于步骤(3)的输入，BP神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积并输入至激活函数，得到隐含层状态值，接着将隐含层输出与输出层权系数相乘并通过激活函数即可得到最终输出层的值输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₂和/或ρ₂，记为候选参数集合2；

当所述个体算法为循环神经网络时，基于步骤(3)的输入，循环神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积以及上一时刻的隐含层状态值与待训练权系数的乘积，将两个乘积的结果进行求和并输入至激活函数，得到当前时刻的隐含层状态值；将当前时刻隐含层状态值乘以权系数并通过激活函数得到最终输出层的值，输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₃和/或ρ₃，记为候选参数集合3；

步骤(5)：将步骤(4)所述的候选参数集合1、候选参数集合2以及候选参数集合3，分别作用于SISO紧格式无模型控制器中，进而分别计算得到三组SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u₁(k)、u₂(k)以及u₃(k)；

步骤(6)：步骤(5)所述控制输入u₁(k)、u₂(k)和u₃(k)分别作用于被控对象后，得到三组被控对象在后一时刻的系统输出实际值，根据系统的期望输出值采用步骤(2)中的误差计算函数计算集成学习中个体算法参数整定所产生对应的临时系统误差，记为err₁(k)、err₂(k)和err₃(k)；

步骤(7)：基于步骤(6)的临时系统误差err₂(k)和err₃(k)，集成学习中的BP神经网络和循环神经网络以最小化各自系统误差函数的值为目标，采用基于链式法则的梯度下降法进行神经网络反向传播计算，目的是更新各自神经网络所有待训练学习的权系数，作为下一时刻神经网络进行前向计算的权系数；所述梯度下降法公式如下：

其中w为各种神经网络中待训练学习的权系数，J(w)是关于权系数w的系统误差函数，α是学习率，为0到1之间的实数；所述反向传播计算过程中，在更新神经网络所有待训练学习的权系数时，使用步骤(5)中所述控制输入u₂(k)以及u₃(k)分别针对SISO紧格式无模型控制器候选参数集合2和候选参数集合3中各个待整定参数在k时刻的偏导数，具体计算公式如下：

当候选参数集合2包含惩罚因子λ₂时，所述控制输入u₂(k)针对所述惩罚因子λ₂在k时刻的偏导数为：

当候选参数集合2包含步长因子ρ₂时，所述控制输入u₂(k)针对所述步长因子ρ₂在k时刻的偏导数为：

当候选参数集合3包含惩罚因子λ₃时，所述控制输入u₃(k)针对所述惩罚因子λ₃在k时刻的偏导数为：

当候选参数集合3包含步长因子ρ₃时，所述控制输入u₃(k)针对所述步长因子ρ₃在k时刻的偏导数为：

其中，φ(k)为k时刻的伪梯度估计值；

步骤(8)：基于步骤(6)的三组临时系统误差err₁(k)、err₂(k)和err₃(k)，利用softmax(归一化指数)函数计算三种个体算法整定参数的权重比例，并根据步骤(4)所述的候选参数集合与权重比例进行加权求和，得到最终SISO紧格式无模型控制器待整定参数，具体计算公式如下：

其中α_i(k)是每一个个体算法在集成学习算法中的权重比例，λ_i(k)和ρ_i(k)表示当前时刻集成学习中所有个体算法整定的参数值；

步骤(9)：基于步骤(2)得到的系统误差e(k)、步骤(8)得到的所述SISO紧格式无模型控制器待整定参数的值，采用SISO紧格式无模型控制器的控制算法，计算得到SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u(k)；

步骤(10)：基于步骤(9)得到的所述控制输入u(k)，计算所述控制输入u(k)分别针对各个所述SISO紧格式无模型控制器待整定参数在k时刻的偏导数，计算公式如下：

当所述SISO紧格式无模型控制器待整定参数中包含惩罚因子λ时，所述控制输入u(k)针对所述惩罚因子λ在k时刻的偏导数为：

当所述SISO紧格式无模型控制器待整定参数中包含步长因子ρ时，所述控制输入u(k)针对所述步长因子ρ在k时刻的偏导数为：

其中，φ(k)为k时刻的伪梯度估计值；