[发明专利]一种基于强化学习的转台控制参数自整定方法在审
申请号: | 201811343796.5 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109521669A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 张祺琛;叶明;胡泓;聂宜云 | 申请(专利权)人: | 中国航空工业集团公司北京航空精密机械研究所 |
主分类号: | G05B11/42 | 分类号: | G05B11/42 |
代理公司: | 中国航空专利中心 11008 | 代理人: | 陈宏林 |
地址: | 100076 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于强化学习的转台控制参数自整定方法及其系统,解决了传统上转台控制参数需要专业人员长时间调节的问题。所述方法包括:通过制定自整定过程的动作集与回报函数,建立了强化学习回路模型。同时,采用参考控制参数作为初始值,减少了无效训练次数。将仿真模拟训练与真实环境微调相结合,进而在能够快速获得训练好的强化学习网络的同时,避免了数学建模误差带来的不利影响。该方法具有能够自动调节转台控制参数的优势,有效提高了转台的生产效率。 | ||
搜索关键词: | 强化学习 转台控制 参数自整定 参考控制参数 仿真模拟 回路模型 控制参数 生产效率 时间调节 数学建模 真实环境 转台 上转台 自整定 微调 回报 网络 制定 | ||
【主权项】:
1.一种基于强化学习的转台控制参数自整定的方法,其特征在于:该方法的步骤如下:步骤一、将转台的速率精度、位置精度设计指标作为PID算法中的超调量、稳态误差、上升时间指标,根据PID算法计算公式计算出超调量、稳态误差、上升时间所对应的Kp、Ki、Kd三个参数,并将Kp、Ki、Kd这三个参数称为转台控制系统参考控制参数;步骤二、在计算机模拟环境下,选取转台模型,将转台的设计指标及转台控制系统参考控制参数输入到转台控制系统结构模型中;步骤三、在计算机模拟环境下,选取工作模式,所述工作模式为强化学习网络训练模式或转台控制参数训练模式,其中:若选取强化学习网络训练模式,首先,对转台设计指标的变化范围及训练次数进行设置,变化范围为设计指标的±10%,在该变化范围内的训练次数选择为50~100次,然后,通过强化学习方式对转台控制系统参考控制参数进行调节,获得转台控制系统实际控制参数;若选取转台控制参数训练模式,首先,直接取值转台的设计指标,训练次数选择为400~500次,然后,通过强化学习方式对转台控制系统参考控制参数进行调节,获得转台控制系统实际控制参数;步骤四、将转台控制系统实际控制参数输入到转台PID控制算法中,然后对转台实际运行情况进行检测,并对转台控制系统实际控制参数进行微调,直至达到技术指标为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司北京航空精密机械研究所,未经中国航空工业集团公司北京航空精密机械研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811343796.5/,转载请声明来源钻瓜专利网。