[发明专利]用于计算机辅助控制和/或调节技术系统的方法有效
申请号: | 200880020134.2 | 申请日: | 2008-04-04 |
公开(公告)号: | CN101689044A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | D·施尼加斯;S·尤德卢夫特 | 申请(专利权)人: | 西门子公司 |
主分类号: | G05B13/02 | 分类号: | G05B13/02 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 卢 江;李家麟 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于计算机辅助控制和/或调节技术系统的方法。在该方法中采用了增强学习方法和人工神经网络。在此在优选的实施形式中并行的前馈网络如此相互逻辑连接,使得架构整体上满足最优性判据。网络在此把所观测的报酬近似作为对所预期的报酬的估计量。这样以最佳的方式和方法来仅仅使用实际上进行的观测来确定品质函数。从网络固有地所获得的品质函数于是提供针对所给定的控制问题的最佳动作选择规则。本发明可以在任意技术系统中被用于调节或控制,优选的应用领域是涡轮机、尤其是燃气涡轮机的调节或控制。 | ||
搜索关键词: | 用于 计算机辅助 控制 调节 技术 系统 方法 | ||
【主权项】:
1.用于计算机辅助控制和/或调节技术系统的方法,其中:a)技术系统的动态特性对于多个时间点(t)分别通过技术系统的状态(st,xt)以及在技术系统上所执行的动作(at)来表征,其中在相应时间点(t)的相应动作(at)引向技术系统在下一时间点(t+1)的后续状态(st+1,xt+1);b)学习具有多个数据组的动作选择规则,其中每个数据组都包括技术系统在相应时间点(t)的状态(st,xt)、在状态(st,xt)所执行的动作(at)以及后续状态(st+1,xt+1),并且给每个数据组分配评估(ri),其中动作选择规则的学习包括以下步骤:i)通过包括技术系统的状态(st,xt)和动作(at)作为参数的一个或多个神经网络(Na(s))来建模品质函数(Q(s,a));ii)根据最优性判据来学习所述一个或多个神经网络(Na(s)),其中所述最优性判据依赖于数据组的评估(ri)以及品质函数(Q(s,a));c)技术系统通过以下方式被调节和/或控制,即利用所学习的动作选择规则根据所学习的所述一个或多个神经网络(Na(s))来选择在技术系统上要执行的动作(at)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200880020134.2/,转载请声明来源钻瓜专利网。
- 上一篇:控制流体调节
- 下一篇:负型感光性树脂组合物、间隔体及液晶显示装置