[发明专利]用于计算机辅助地学习对技术系统的控制和/或调节的方法有效
申请号: | 201010279903.X | 申请日: | 2010-09-09 |
公开(公告)号: | CN102023570A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | A·汉斯;S·乌德卢夫特 | 申请(专利权)人: | 西门子公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张涛;李家麟 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于计算机辅助地学习对技术系统的控制和/或调节的方法,其中该技术系统的运行由该技术系统在运行中可以采取的状态以及在该技术系统的运行期间可以被执行并且将该系统的相应状态转变成后继状态的动作来表征。在根据本发明的方法中,在学习对该技术系统的控制时适当地考虑在学习时所使用的训练数据的统计不确定性。这通过如下方式进行:借助于不确定性传播确定对该技术系统的优化运行进行建模的质量函数的统计不确定性,并且在学习动作选择规则时将其引入。在此,根据本发明的方法的特征在于,所述不确定性传播使用非对角元素被忽略的协方差矩阵。通过该近似,该方法变得计算效率非常高,并且在执行时需要小的存储空间需求。 | ||
搜索关键词: | 用于 计算机辅助 学习 技术 系统 控制 调节 方法 | ||
【主权项】:
1.一种用于计算机辅助地学习对技术系统进行控制或调节的方法,其中该技术系统的运行由该技术系统在运行中能够采取的状态(s)以及在该技术系统的运行期间被执行并且将该系统的相应状态(s)转变为后继状态的动作来表征,其中-基于在该技术系统的运行中所检测的包括状态(s)、动作(a)和后继状态(s′)的训练数据来学习质量函数(Q)和动作选择规则(∏(S)),其中质量函数(Q)对该技术系统的优化运行进行建模,并且动作选择规则(∏(S))在该技术系统运行时针对该技术系统的相应状态(s)说明要优选执行的一个或多个动作(a);-在学习质量函数(Q)和动作选择规则(∏(S))期间,借助于不确定性传播来确定质量函数(Q)的统计不确定性的度量
并且根据统计不确定性的度量
以及对应于对质量函数(Q)的统计最小要求的确定性参数(ξ)来确定经过修改的质量函数,其中所述不确定性传播使用非对角元素被忽略的协方差矩阵;以及-其中基于经过修改的质量函数来学习动作选择规则(∏(S))。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010279903.X/,转载请声明来源钻瓜专利网。
- 上一篇:用于形成环境冷却或加热系统的模块化面板
- 下一篇:内燃机的燃料喷射控制装置