[发明专利]一种信息处理方法及相关设备有效
申请号: | 201910159706.5 | 申请日: | 2019-03-01 |
公开(公告)号: | CN111639097B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 肖昌南 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06Q10/0631 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 相关 设备 | ||
1.一种信息处理方法,其特征在于,包括:
构建油气集输联合站库的模拟系统,所述模拟系统包括所述油气集输联合站库中的设备对应的物理模型;
获取所述油气集输联合站库中设备的第一运行状态;
将所述第一运行状态进行向量化处理;
确定状态空间以及动作空间;
确定所述油气集输联合站库对应的初始动作模型,所述初始动作模型包括第一模块以及第二模块,所述第一模块以及所述第二模块均由人工神经网络构成;
步骤1、随机挑选所述状态空间中的状态输入所述第一模块,以输出第一动作,所述第一动作为所述动作空间中与输入所述第一模块的状态对应的动作;
步骤2、基于所述第一动作以及所述模拟系统确定第二运行状态;
步骤3、基于所述第二模块确定所述第二运行状态的价值;
步骤4、确定所述第二运行状态的奖励值;
步骤5、通过所述第二运行状态的价值以及所述第二运行状态的奖励值更新所述第一模块的第一参数的参数值;
步骤6、通过所述第二运行状态的价值更新所述第二模块的第二参数的参数值;
重复执行步骤1至步骤6,直至满足预置迭代终止条件;
将迭代终止时的所述初始动作模型确定为预设动作模型;
将向量化处理后的所述第一运行状态输入所述预设动作模型以确定目标动作概率分布,所述目标动作概率分布中的动作用于对所述油气集输联合站库中的设备进行操作,所述预设动作模型为通过对所述状态空间和所述动作空间进行训练得到,所述状态空间包括离散化后所述油气集输联合站库中的设备的静态参数,所述动作空间包括离散化后所述油气集输联合站库中的设备的操作动作,且所述操作动作与所述静态参数具有关联关系。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断迭代次数是否达到预置数值,若是,则确定满足所述预置迭代终止条件;
或,
判断所述第一模块的第一参数的参数值和/或所述第二模块的第二参数的参数值是否收敛,若是,则确定满足所述预置迭代终止条件。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述目标动作概率分布中概率最高的目标动作确定所述模拟系统的第三运行状态;
确定所述第三运行状态的奖励值以及所述第三运行状态的价值;
基于所述第三运行状态的奖励值以及所述第三运行状态的价值调节所述预设动作模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910159706.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电路基材、柔性薄膜电路及其制作方法
- 下一篇:一种信息处理方法及相关设备