[发明专利]基于强化学习的多Agent污水处理决策支持系统有效

专利信息
申请号: 201110147186.X 申请日: 2011-06-02
公开(公告)号: CN102207928A 公开(公告)日: 2011-10-05
发明(设计)人: 倪建军;刘明华;马华伟;谭宪军 申请(专利权)人: 河海大学常州校区
主分类号: G06F15/18 分类号: G06F15/18;G06N99/00
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 213022 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于强化学习的多Agent污水处理决策支持系统,将水污染源附近的污水处理厂抽象成具有一定属性的Agent主体,将强化学习与Agent概念相结合,定义强化学习的状态集、动作集;初始化强化学习中Q学习的参数,包括学习速率、折扣因子、Q值;各个Agent通过感知模块获得当前状态,并根据动作选择策略选择当前状态下最优动作;根据Q学习中的Q值公式进行Q值的计算与更新;一次学习过程结束,等待或者马上进入下一个学习过程,直到Q值收敛,得到最优决策。本发明从整个污水处理系统的全局出发,宏观调配污水处理厂的使用情况,具有较高的灵活性与自适应能力,并且可扩展性也非常高,具有较高的实用价值。
搜索关键词: 基于 强化 学习 agent 污水处理 决策 支持系统
【主权项】:
一种基于强化学习的多Agent污水处理决策支持系统,其特征是,包括以下步骤:a、将水污染源附近的n个污水处理厂分别抽象成具有一定属性的Agent主体,每个Agent包括污水处理厂的处理能力C、污水处理厂与污染源的距离D、主要针对处理的污染物质E、单位距离污水运输的费用P1、单位体积污水处理的费用P2;b、将强化学习与Agent相结合,定义强化学习的状态集S={C,D,E,P1,P2},动作集A={a1,a2},其中,a1表示该Agent加入污水处理系统,a2表示该Agent不加入污水处理系统;c、初始化强化学习中Q学习的参数,包括学习速率、折扣因子、Q值;d、各个污水处理厂Agent通过感知模块获得当前状态s,s∈S,并根据动作选择策略选择当前状态s下最优动作;e、动作选择策略采用Boltzmann策略,通过执行动作a得到新的状态s′,同时从外界环境得到回报值r;f、对Q学习中的Q值进行Q值的计算与更新;g、一次学习过程结束,等待或者马上进入下一个学习过程,直到Q值收敛,得到最优决策,选择最佳的一个或多个污水处理厂Agent加入此次污水处理过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110147186.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top