[发明专利]一种基于深度强化学习的高炉布料方法及系统有效

专利信息
申请号: 202110937412.8 申请日: 2021-08-16
公开(公告)号: CN113637819B 公开(公告)日: 2022-10-18
发明(设计)人: 何树营;赵春鹏;李智杰;周春晖 申请(专利权)人: 中冶东方工程技术有限公司
主分类号: C21B7/20 分类号: C21B7/20;C21B5/00
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 266555 山东省青岛市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 强化 学习 高炉 布料 方法 系统
【权利要求书】:

1.一种基于深度强化学习的高炉布料方法,其特征在于,包括:

获取高炉的实际料面状态数据;

将所述实际料面状态数据输入到预设的高炉布料矩阵优化深度强化学习模型中,得到优化的布料矩阵;

通过优化的布料矩阵对高炉的布料系统进行自主控制;

其中,所述高炉布料矩阵优化深度强化学习模型训练时,考虑实际料面状态、布料矩阵、实施布料矩阵后获得的奖励或惩罚以及进行布料后对实际料面产生的影响;将布料系统的瞬时奖励函数设置为高炉实际料面与理想料面的差值;

高炉布料矩阵优化深度强化学习模型训练内容包括:沿损失函数减小的梯度方向调整深度网络的权值;所述高炉布料矩阵优化深度强化学习模型包括目标网络模块和预测网络模块;目标网络和预测网络沿损失函数梯度下降的方向交替更新权值;预测网络模块估计高炉料面的状态,并输出高炉布料系统在该状态下采用不同布料矩阵时的价值,根据估计出的高炉料面状态对应的动作价值进行布料矩阵动作的选择,并将选择到的最优布料矩阵动作反馈到目标网络模块中,目标网络模块负责评价功能,对预测网络估计的状态值、动作值、状态以及动作进行评价。

2.如权利要求1所述的一种基于深度强化学习的高炉布料方法,其特征在于,高炉布料矩阵优化深度强化学习模型训练主要内容包括:

获取高炉布料历史数据,包括实际料面状态、布料矩阵、实施布料矩阵后获得的奖励或惩罚以及进行布料后对实际料面产生的影响;

从所述历史数据中批量选择一段数据;根据当前时刻的实际料面状态,制定当前时刻的布料策略设置布料矩阵;根据高炉料面实际反馈得到布料的实际奖励;并估计出下一时刻最优的料面状态和采取的最优的布料矩阵动作;

沿损失函数减小的梯度方向调整深度网络的权值;迭代训练直至深度网络达到最优。

3.如权利要求2所述的一种基于深度强化学习的高炉布料方法,其特征在于,对获取的高炉布料历史数据进行规则化处理;规则化数据格式为五元组,包括,前时刻高炉料面状态、当前时刻的高炉布料的动作、当前动作获得的奖励值、该奖励值按设定好的奖励规则计算以及执行动作后下一时刻的高炉料面状态。

4.如权利要求2所述的一种基于深度强化学习的高炉布料方法,其特征在于,所述高炉布料矩阵优化深度强化学习模型包括目标网络模块和预测网络模块,目标网络和预测网络沿损失函数梯度下降的方向交替更新权值,直至满足迭代条件生成最优布料矩阵优化模型。

5.如权利要求1所述的一种基于深度强化学习的高炉布料方法,其特征在于,获取高炉的实际料面状态数据是连续的,获取每一时刻的实际料面的状态。

6.如权利要求1所述的一种基于深度强化学习的高炉布料方法,其特征在于,所述高炉布料矩阵优化深度强化学习模型的输入状态值为连续获取的高炉实际的料面状态,输出的是布料矩阵,包括布料的角度和布料的圈数。

7.如权利要求1所述的一种基于深度强化学习的高炉布料方法,其特征在于,对训练好的高炉布料矩阵优化深度强化学习模型进行封装集成为独立的系统,并与布料和检测设备通信,实现布料的自主控制。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中冶东方工程技术有限公司,未经中冶东方工程技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110937412.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top