[发明专利]成套设备的控制方法及控制装置有效
申请号: | 200910126483.9 | 申请日: | 2007-02-28 |
公开(公告)号: | CN101504152A | 公开(公告)日: | 2009-08-12 |
发明(设计)人: | 金田昌基;山田昭彦;关合孝朗;林喜治;楠见尚弘;深井雅之;清水悟 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | F23N5/00 | 分类号: | F23N5/00;G05B13/04;F22B35/18 |
代理公司: | 北京银龙知识产权代理有限公司 | 代理人: | 熊志诚 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 成套设备 控制 方法 装置 | ||
本申请是申请号为200710084770.9,申请日为2007年2月28日,发明名称为“具有燃烧装置的控制对象物的控制装置及具有锅炉的成套设备的控制装置”的发明专利申请的分案申请。
技术领域
本发明涉及具有锅炉的成套设备的控制方法及控制装置。
背景技术
以往,在成套设备控制领域以PID控制为基本的控制逻辑是主流。另外,还提出利用以神经网络为代表的带教师学习功能,能与成套设备的特性灵活对应的多种技术方案。
为了使用带教师学习功能来构成控制装置,由于需要预先准备成为教师数据的成功案例,因此还提出了无教师学习方法。
作为无教师学习的例子,有强化学习法。
强化学习法是为了通过与控制对象等环境的反复试验的相互作用,将从环境得到的计测信号作为理想的信号,生成对环境的操作信号的学习控制的构架。由此有如下优点,即,即使在不能预先准备成功案例的场合,只要通过预先定义所希望的状态,就能自己根据环境学习所希望的行动。
在强化学习中具有如下学习功能,即,以使用从环境得到的计测信号所计算的标量的评价值(在强化学习中被称为报酬)为线索,生成对环境的操作信号,使得从现有状态到将来所得到的评价值的预期值达到最大。作为实现这种学习功能的方法,有例如非专利文献1(强化学习(Reinforcement Learning),三上贞芳、皆川雅章共同翻译,森北出版株式会社,2000年12月20日出版)所述的Actor-Critic、Q学习、实时动态程序设计(実時間Dynamic Programming)等算法。
另外,作为改进上述方法的强化学习的构架,上述文献介绍了被称为动态-体系结构(Dyna-ア一キテクチヤ)的构架。这是一种以模拟控制对象的 模型为对象预先学习生成怎样的操作信号比较好,然后使用该学习结果决定对控制对象施加的操作信号的方法。而且,具有减小控制对象和模型的误差的模型调整功能。
另外,在具备燃烧装置的成套设备的控制装置中存在如下问题,即,在例如像煤燃料那样燃料性质不定的场合或变更了煤种类的场合等,成套设备的燃烧特性或导热特性发生变化。作为对应该问题的方法,可列举例如专利文献1-日本特开2004-190913号公报所述的技术。
这是一种在烧煤锅炉中从主蒸汽压力的实测值和设定值的偏差运算燃料发热量比的方法。
另外,专利文献2-日本特开平8-200604号公报的控制装置包括:算出基于与烧煤锅炉在炉膛上的温度、压力、流量等有关的流体计测数据而估算的炉膛的吸收热量估算值的第一估算单元;算出基于与最终二次燃烧器的温度、压力、流量等有关的流体计测数据而估算的最终二次燃烧器的吸收热量估算值的第二估算单元;求出用上述第一估算单元算出的炉膛的吸收热量估算值和用上述第二估算单元算出的最终二次燃烧器的吸收热量估算值之比的单元;以及,基于利用该单元求出的吸收热量估算值之比掌握锅炉的燃烧特性,输出气体分配阻尼器设定值、气体再循环鼓风机的转数设定值以及锅炉输入加速设定值的运算单元。
另外,在锅炉等成套设备控制领域,以往,以PID控制为基本的控制逻辑成为主流。另外,还提出利用以神经网络为代表的带教师学习功能,能与成套设备的特性灵活对应的多种技术方案。并且,为了使用带教师学习功能来构成控制装置,由于需要预先准备成为教师数据的成功案例,因此还提出了强化学习法等的无教师学习方法。
该强化学习法是为了通过与控制对象等环境的反复试验的相互作用,将从环境得到的计测信号作为理想的信号,生成对环境的操作信号的学习控制的构架。由此有如下优点,即,即使在不能预先准备成功案例的场合,只要通过预先定义所希望的状态,就能自己根据环境学习所希望的行动。
并且,在该强化学习中具有如下学习功能,即,以使用从环境得到的计测信号所计算的标量的评价值(在强化学习中被称为报酬)为线索,生成对环境 的操作信号,使得从现有状态到将来所得到的评价值的预期值达到最大。在实现这种学习功能的方法中,以往有Actor-Critic、Q学习、实时动态程序设计(実時間Dynamic Programming)等算法。
另外,作为改进上述方法的强化学习的构架,有被称为动态-体系结构(Dyna-ア一キテクチヤ)的构架。这是一种以模拟控制对象的模型为对象预先学习生成怎样的操作信号比较好,然后使用该学习结果决定对控制对象施加的操作信号的方法,这时,具有减小控制对象和模型的误差的模型调整功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910126483.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冰箱
- 下一篇:监测混合动力系统的辅助泵的方法