[发明专利]基于Q-learning的船舶PID控制参数整定方法、系统及存储介质在审
申请号: | 202110196677.7 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112947054A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李诗杰;张培;刘佳仑;王乐;谢玲利 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G05B11/42 | 分类号: | G05B11/42 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 常柯阳 |
地址: | 430063 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 learning 船舶 pid 控制 参数 方法 系统 存储 介质 | ||
本发明公开了一种基于Q‑learning的船舶PID控制参数整定方法、系统及存储介质。所述方法包括以下步骤:确定船舶状态;确定PID控制参数的动作;根据所述船舶状态和所述PID控制参数的动作采用Q‑learning算法对船舶PID控制参数进行整定。本发明中的方法通过船舶状态、PID控制参数的动作以及Q‑learning算法,来精确调整PID控制参数,提高船舶控制精度,避免依靠工程经验进行人工试凑控制参数的繁琐重复的操作,进而避免人工试凑参数过程导致的船舶控制系统不稳定的情况发生。本发明可广泛应用于船舶控制技术领域内。
技术领域
本发明涉及船舶控制技术领域,尤其是一种基于Q-learning的船舶PID控制参数整定方法、系统及存储介质。
背景技术
PID(Proportion Integration Differentiation,比例-积分-微分)控制是控制领域最为广泛使用的一种控制方式,传统的PID控制是基于输出误差的反馈机制,主要是指PID调节器,其具体形式可表述如下:
其中,Kp为比例增益,Ki为积分增益,Kd为微分增益,PID控制虽然具有结构简单、容易实现的特点,但要想利用PID控制系统来控制船舶的航向,往往需要人工对Kp、Ki和Kd这三个参数进行繁琐地整定调节,而调节整定工作通常是依靠工程经验,对人为经验的依赖性较大,并且在人工调节整定参数的过程中,随机性较大,人工调节整定参数会大概率导致船舶控制系统无法稳定运行。
发明内容
本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本发明实施例的一个目的在于提供一种基于Q-learning的船舶PID控制参数整定方法,该方法能够基于Q-learning的船舶PID控制参数整定。
本发明实施例的另一个目的在于提供一种基于Q-learning的船舶PID控制参数整定系统以及计算机可读的存储介质。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种基于Q-learning的船舶PID控制参数整定方法,包括以下步骤:
确定船舶状态;
确定PID控制参数的动作;
根据所述船舶状态和所述PID控制参数的动作,采用Q-learning算法对船舶PID控制参数进行整定。
进一步,所述确定船舶状态这一步骤,包括以下步骤:
构建船舶航向空间状态模型;
根据所述船舶航向空间状态模型确定航行误差数据;
根据所述航行误差数据构建船舶状态表,所述船舶状态表包括若干个船舶状态。
进一步,所述PID控制参数包括比例增益、积分增益和微分增益,所述确定PID控制参数的动作这一步骤,包括以下步骤:
确定所述比例增益的步长和起始值,确定第一维参数;
确定所述积分增益的步长和起始值,确定第二维参数;
确定所述微分增益的步长和起始值,确定第三维参数;
根据所述第一维参数、所述第二维参数和所述第三维参数构建PID控制参数动作表,所述PID控制参数表包括若干个PID控制参数的动作。
进一步,所述根据所述船舶状态和所述PID控制参数的动作采用Q-learning算法对船舶PID控制参数进行整定这一步骤,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110196677.7/2.html,转载请声明来源钻瓜专利网。