[发明专利]基于强化学习的多Agent污水处理决策支持系统有效

申请号：	201110147186.X	申请日：	2011-06-02
公开（公告）号：	CN102207928A	公开（公告）日：	2011-10-05
发明（设计）人：	倪建军;刘明华;马华伟;谭宪军	申请（专利权）人：	河海大学常州校区
主分类号：	G06F15/18	分类号：	G06F15/18;G06N99/00
代理公司：	南京纵横知识产权代理有限公司 32224	代理人：	董建林
地址：	213022 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于强化学习的多Agent污水处理决策支持系统，将水污染源附近的污水处理厂抽象成具有一定属性的Agent主体，将强化学习与Agent概念相结合，定义强化学习的状态集、动作集；初始化强化学习中Q学习的参数，包括学习速率、折扣因子、Q值；各个Agent通过感知模块获得当前状态，并根据动作选择策略选择当前状态下最优动作；根据Q学习中的Q值公式进行Q值的计算与更新；一次学习过程结束，等待或者马上进入下一个学习过程，直到Q值收敛，得到最优决策。本发明从整个污水处理系统的全局出发，宏观调配污水处理厂的使用情况，具有较高的灵活性与自适应能力，并且可扩展性也非常高，具有较高的实用价值。
搜索关键词：	基于强化学习 agent 污水处理决策支持系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于强化学习的多Agent污水处理决策支持系统，其特征是，包括以下步骤：a、将水污染源附近的n个污水处理厂分别抽象成具有一定属性的Agent主体，每个Agent包括污水处理厂的处理能力C、污水处理厂与污染源的距离D、主要针对处理的污染物质E、单位距离污水运输的费用P1、单位体积污水处理的费用P2；b、将强化学习与Agent相结合，定义强化学习的状态集S＝{C，D，E，P1，P2}，动作集A＝{a1，a2}，其中，a1表示该Agent加入污水处理系统，a2表示该Agent不加入污水处理系统；c、初始化强化学习中Q学习的参数，包括学习速率、折扣因子、Q值；d、各个污水处理厂Agent通过感知模块获得当前状态s，s∈S，并根据动作选择策略选择当前状态s下最优动作；e、动作选择策略采用Boltzmann策略，通过执行动作a得到新的状态s′，同时从外界环境得到回报值r；f、对Q学习中的Q值进行Q值的计算与更新；g、一次学习过程结束，等待或者马上进入下一个学习过程，直到Q值收敛，得到最优决策，选择最佳的一个或多个污水处理厂Agent加入此次污水处理过程。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河海大学常州校区，未经河海大学常州校区许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110147186.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F15-00 通用数字计算机
G06F15-02 .通过键盘输入的手动操作，以及应用机内程序的计算，例如，袖珍计算器
G06F15-04 .在引入被处理的数据的同时，进行编制程序的，例如，在同一记录载体上
G06F15-08 .应用插接板编制程序的
G06F15-16 .两个或多个数字计算机的组合，其中每台至少具有一个运算器、一个程序器及一个寄存器，例如，用于数个程序的同时处理
G06F15-18 .其中，根据计算机本身在一个完整的运行期间内所取得的经验来改变程序的；学习机器

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于强化学习的多Agent污水处理决策支持系统有效

专利文献下载