[发明专利]一种复值域连续时间非线性系统最优控制方法在审
申请号: | 202211318982.X | 申请日: | 2022-10-26 |
公开(公告)号: | CN115840357A | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王爱钦 | 申请(专利权)人: | 四川启睿克科技有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 刘兴亮 |
地址: | 610000 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 值域 连续 时间 非线性 系统 最优 控制 方法 | ||
本发明公开了一种复值域连续时间非线性系统最优控制方法,通过将控制模型分割为实部模型和虚部模型,建立实部和虚部两个代价函数来构造复数形式的完全代价函数,通过代价函数构造策略迭代最优控制算法,使用一种新的采样收敛分析方法保证收敛性,并通过三层复数前向神经网络实现了最优控制算法。
技术领域
本发明涉及最优控制技术领域,尤其涉及一种复值域连续时间非线性系统最优控制方法。
背景技术
最优控制是近年来的热门技术领域。由于工程实践中的大多数问题都具有控制约束,因此出现了在约束条件下寻求最优控制策略的现代变分理论,其中最常用的研究方法是动态规划和最大值原理。从最优控制中衍生出许多方向,如动态规划与强化学习相结合形成自适应动态规划的近似控制方法、预测控制等。复数不仅在对数域的发展中具有重要的理论意义,随着科学技术的发展,复数已广泛应用于系统分析、信号分析、广义积分、量子力学、流体力学等方面。有许多关于复数的讨论,涉及复数的使用,将复数的概念引入神经网络,这都涉及复数神经网络的研究,在基于自适应动态规划的方法中关于复数控制的算法很少。
发明内容
在传统的非线性系统最优控制中,基本都是对于实数值的最优控制。尤其是基于自适应动态规划的最优控制方式中缺乏对复数模型的算法应用,本发明提供一种新的基于自适应动态规划方法的复数非线性系统最优控制算法,在提出的非线性系统控制模型基础上分割为实部模型和虚部模型,通过创新的建立实部和虚部的代价函数构造关于复数系统的代价函数,通过构造函数完成策略迭代最优控制算法,并构造三层复数前向神经网络,实现复数非线性系统最优控制。
本发明提出了一种新的控制模型和代价函数构造方法来完成复值连续时间非线性系统的最优控制算法,函数模型中使用的数据都是复数,将传统控制模型分割为实部模型和虚部模型,通过创新的建立实部和虚部的代价函数,构造统一的复数形式代价函数并使用一种新的采样收敛方法完成收敛分析,通过构建复值前向神经网络实现最优控制算法。
本发明通过以下技术方案来实现上述目的:
一种复值域连续时间非线性系统最优控制方法,包括以下步骤:
步骤1,将非线性系统控制模型分割为实部模型和虚部模型;
步骤2,建立实部和虚部的代价函数构造关于复数系统的代价函数;
步骤3,通过代价函数完成策略迭代最优控制算法,并构造三层复数前向神经网络,实现复数非线性系统最优控制。
根据一类复数连续时间非线性系统,系统动态描述为:
其中z(t)∈Rn是一种复数状态,f(·)∈Rn是未知的非线性函数,并且满足f(0)=0,u(t)是控制输入,C∈Rn×1是增益矩阵。
假设状态z(t)被分离为实部和虚部,表示如下:
z(t)=x(t)+iy(t), (2)
其中x(亡)和y(亡)分别是z(t)的实部和虚部.f(z(t))被分离为:
f(z(t))=fR(x(t),y(t))+ifI(x(t),y(t)) (3)
根据(1)-(3),重写实部和虚部为:
然后(4)和(5)重新写成:
根据(6),受自适应动态规划思想的启发,定义代价函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川启睿克科技有限公司,未经四川启睿克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211318982.X/2.html,转载请声明来源钻瓜专利网。