[发明专利]信息处理装置、信息处理方法以及程序在审
申请号: | 202011146544.0 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112749785A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 釜谷幸男;伊藤秀将;花井克之;汤浅真由美;苏鸣镝 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 以及 程序 | ||
1.一种信息处理装置,具备:
定义部,将属性与节点和边缘建立对应而进行定义,基于表示系统的结构的图结构的数据,定义与表示所述图结构的数据的模型相关的卷积函数;
评价部,对所述模型输入所述系统的状态,针对使所述模型按每个时间步长产生可设想的结构变化后的一个以上的变更后模型的体系,按每个所述时间步长求出作为所述结构变化的概率分布而给出的策略函数与强化学习所需的状态价值函数,并基于所述策略函数评价所述系统的结构变化;以及
强化学习部,通过使用在将所述结构变化应用于所述系统的情况下所产生的成本即回报值、所述状态价值函数、以及所述模型来进行强化学习,从而使所述系统的结构变化优化。
2.如权利要求1所述的信息处理装置,
所述定义部定义与所述系统所具有的设备的设备种类相应的卷积函数。
3.如权利要求1所述的信息处理装置,
所述强化学习部将进行所述强化学习的结果获得的所述卷积函数的系数即参数输出至所述定义部,
所述定义部基于所述强化学习部输出的所述参数,更新所述卷积函数的参数,
所述评价部将更新后的所述参数反映在所述模型中,并对反映了所述参数的所述模型进行评价。
4.如权利要求1所述的信息处理装置,
所述定义部在所述系统中将所述结构变化的候选作为候选节点编入所述图结构,将所述候选节点构成为单向连接的所述卷积函数,
所述评价部使用所述单向连接的所述卷积函数构成所述模型。
5.如权利要求4所述的信息处理装置,
所述评价部使用在所述图结构中连接有所述候选节点的所述模型,通过并行处理对连接有所述候选节点的节点与所述候选节点的每个组合的所述模型进行评价。
6.如权利要求1所述的信息处理装置,
所述信息处理装置还具备提示部,该提示部将所述评价部所评价的所述系统的结构变化和与所述系统的结构变化相关的成本一起提示。
7.一种信息处理方法,使计算机执行如下步骤:
将属性与节点和边缘建立对应而进行定义,基于表示系统的结构的图结构的数据,定义与表示所述图结构的数据的模型相关的卷积函数;
对所述模型输入所述系统的状态,针对使所述模型按每个时间步长产生可设想的结构变化后的一个以上的变更后模型的体系,按每个所述时间步长求出作为所述结构变化的概率分布而给出的策略函数与强化学习所需的状态价值函数,并基于所述策略函数评价所述系统的结构变化;
通过使用在将所述结构变化应用于所述系统的情况下所产生的成本即回报值、所述状态价值函数、以及所述模型来进行强化学习,从而使所述系统的结构变化优化。
8.一种程序,使计算机执行如下步骤:
将属性与节点和边缘建立对应而进行定义,基于表示系统的结构的图结构的数据,定义与表示所述图结构的数据的模型相关的卷积函数;
对所述模型输入所述系统的状态,针对使所述模型按每个时间步长产生可设想的结构变化后的一个以上的变更后模型的体系,按每个所述时间步长求出作为所述结构变化的概率分布而给出的策略函数与强化学习所需的状态价值函数,并基于所述策略函数评价所述系统的结构变化;
通过使用在将所述结构变化应用于所述系统的情况下所产生的成本即回报值、所述状态价值函数、以及所述模型来进行强化学习,从而使所述系统的结构变化优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011146544.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:功率半导体装置
- 下一篇:用于压合条带的压合辊