[发明专利]基于控制策略更新时间预测的优化控制系统与方法在审
申请号: | 202211091378.8 | 申请日: | 2022-09-07 |
公开(公告)号: | CN116382070A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 赵博;袁郭玲;林铭铎;夏宏兵 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 昆明合众智信知识产权事务所 53113 | 代理人: | 汤文旋 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 控制 策略 更新 时间 预测 优化 控制系统 方法 | ||
本发明提供一种基于控制策略更新时间预测的优化控制系统与方法,包括构建非线性系统的动力学模型和代价函数、获取非线性系统的非线性李雅普诺夫函数和哈密顿函数,得到最优代价函数及哈密顿—雅可比—贝尔曼方程,确定最优神经控制策略的闭环形式、构建一个权重向量协同更新的评判神经网络,来估计最优代价函数、设计自触发条件,使用前一个触发时刻和对应的状态预测下一个触发时刻、求解哈密顿—雅可比—贝尔曼方程,间接地获得最优神经控制策略,并在预测的触发时刻进行更新和将获得的最优控制策略应用于系统。本发明采用ADP的方法,并设计自触发条件,从而获得无需持续监测系统状态的最优控制系统与方法,减少了计算量,节省了通信带宽和能量消耗。
技术领域
本发明涉及自动控制系统领域,具体为一种基于控制策略更新时间预测的优化控制系统与方法。
背景技术
随着自动控制系统在理论研究和实际应用中的不断发展,目前绝大多数的控制方式都是基于数字平台实现的,需要依赖传感器进行数据的采集和处理,将各种模拟信号转化为数字信号,然后传递给下一个处理单元进行计算、处理等操作,所以该过程中需要传感器连续不断地进行数据采样,以求保证尽可能的还原信号的本来面目。传感器采样虽然是连续不断的过程,但最终得到的数据仍然是离散的,因此需要将该离散的数据通过零阶保持器变为连续信号,在传统的控制方式中这一过程是周期进行的,也被称作时间触发机制。
尽管这种采样方式有很多的优点且更易于设计,但近年来由于通信技术的不断发展,其缺点却越来越凸显。由于周期采样的特性,在一个控制系统中需要连续不断的对系统状态进行采样,这给现代大型或复杂的控制系统带来的计算资源消耗不可想象。例如,在许多现代控制系统中广泛使用的网络化传输,系统状态一般被采样后通过有线或无线方式传输到远端,在此过程中如果网络通信带宽是有限的,那么采用时间触发机制可能会造成网络拥堵和网络资源的浪费,进而会导致系统资源浪费。与时间触发控制不同,事件触发控制方法具有非周期性的采样特性,只有当系统状态的偏差量超过某个触发条件限定的阈值,才会进行传感器采样和控制器运算,这大大减少了控制器、传感器和执行器之间的数据传输,从而降低了计算负担,节约了通信带宽和能耗。虽然事件触发控制明显优于周期性控制,但触发条件需要硬件设备对系统状态进行持续监控。当系统结构的规模和复杂性不断增加时,资源和能源也会相应增加。因此,为了保证系统的稳定性和控制性能,开发一种同时提供满意的控制性能水平,无需持续监测状态的硬件设备,还能降低资源和能源消耗的控制系统与方法非常迫切。
针对不同场景下的非线性系统,研究人员正在努力研究相应的最优控制方法以实现足够的控制水平。动态规划方法被认为是寻求最优控制的经典而有效的工具,自适应动态规划(Adaptive dynamic programming,ADP)作为解决传统动态规划算法常面临的“维数灾”的有效方法,其主要思想是借助函数估计器(如神经网络和模糊逻辑等)结合动态规划、强化学习等技术近似求解哈密顿—雅可比—贝尔曼方程,进而得到最优控制系统。
对于不同类型的系统,研究人员结合事件触发和自触发机制进行了一些有益的尝试。为了避免使用硬件设备对系统状态进行持续检测,一些研究者在设计控制器时引入了自触发机制,但是现有的ADP控制方法的计算负担大、通信频率和能耗高,为了避免在现有的事件触发控制策略中使用硬件设备进行持续监测,降低计算负担、通信带宽和能耗,开发一种基于控制策略更新时间预测的优化控制系统与方法是十分必要的。
发明内容
本发明的目的在于提供一种基于控制策略更新时间预测的优化控制系统与方法,针对现有ADP控制方法计算负担大、通信频率和能耗高等问题,发明一种基于控制策略更新时间预测的优化控制系统与方法。该方法构建了一个带有权重向量协同更新的评判神经网络,保证权重误差动态的渐近稳定性,估计非线性系统的最优代价函数,进而求解哈密顿-雅可比-贝尔曼方程,间接地获得最优神经控制策略,同时,设计了一个合适的自触发条件以预测下一个控制信号更新时刻,进而避免在事件触发控制方法中使用硬件设备对系统状态进行持续监测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211091378.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于鸡蛋印制二维码的打印机
- 下一篇:一种电力系统架线装置