[发明专利]锌电解过程无模型自适应学习型最优化控制方法及系统有效
申请号: | 201910403645.2 | 申请日: | 2019-05-15 |
公开(公告)号: | CN110109356B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 李勇刚;石雄涛;阳春华;朱红求;桂卫华;孙备;龙双;刘卫平 | 申请(专利权)人: | 中南大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 马家骏 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种锌电解过程无模型自适应学习型最优化控制方法及系统,该方法通过自定义锌电解的状态空间和动作空间,并根据与锌电解环境交互产生的数据训练动作网络和价值网络,通过软更新算法更新目标动作网络和目标价值网络,获得锌电解DDPG模型,以及根据锌电解DDPG模型,获得与当前锌电解状态对应的最优新液流量,解决了现有技术由于锌电解过程的复杂性、大时滞、采样不充分,导致锌电解建模不精确,从而无法实现锌电解过程的最优控制的技术问题,不仅能够通过自学习实现新液流量的最优控制,从而获得最优酸锌比,而且能有效降低电解过程的能耗,进而提高锌电解过程的稳定性。 | ||
搜索关键词: | 电解 过程 模型 自适应 学习 优化 控制 方法 系统 | ||
【主权项】:
1.一种锌电解过程无模型自适应学习型最优化控制方法,其特征在于,所述方法包括:建立DDPG算法采用的动作网络、价值网络、目标动作网络以及目标价值网络,并随机初始化动作网络、价值网络、目标动作网络以及目标价值网络的网络参数;定义锌电解的状态空间和动作空间,所述锌电解的动作空间为新液流量,状态空间S具体为:S={C1,1,C1,2,C2,1,C2,2,C3,1,C3,2,C4,1,C4,2,VC,ε},其中,C1,1和C1,2分别代表新液的酸离子浓度和锌离子浓度,C2,1和C2,2分别代表混合槽的酸离子浓度和锌离子浓度,C3,1和C3,2代表电解槽的酸离子浓度和锌离子浓度,C4,1和C4,2代表废液槽的酸离子浓度和锌离子浓度,VC代表电解槽电压,ε代表电解槽的电流效率;根据与锌电解环境交互产生的数据[st,at,rt,st+1]训练动作网络和价值网络,采用软更新算法更新目标动作网络和目标价值网络,从而获得锌电解DDPG模型,其中st为t时刻的锌电解状态,at为在t时刻,锌电解状态为st时采用的新液流量,rt为锌电解状态为st时采用的新液流量at使锌电解状态变为st+1时收到的立即奖励,st+1为t+1时刻的锌电解状态;根据所述锌电解DDPG模型,获得与当前锌电解状态对应的最优新液流量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910403645.2/,转载请声明来源钻瓜专利网。