[发明专利]基于强化学习粒子群算法的污水处理优化控制方法有效
申请号: | 202010110081.6 | 申请日: | 2020-02-23 |
公开(公告)号: | CN111290275B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 郑慧;介婧;单胜道;武晓莉;周乐;张淼;陆鲁 | 申请(专利权)人: | 浙江科技学院 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;C02F1/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 郑芳 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 粒子 算法 污水处理 优化 控制 方法 | ||
1.一种基于强化学习粒子群算法的污水处理优化控制方法,其特征在于包括下述步骤:
(1)构建基于强化学习的污水处理过程智能体四要素:状态、环境、奖励及行动;
(2)建立基于强化学习粒子群算法的污水处理优化控制流程:
智能体行动调整策略具体操作为依据粒子候选解当前位置,给出为提高适应度值的粒子运行速度;策略中,由神经网络函数记忆浓度设定值调整趋势,即粒子最优运行速度;该步骤又分为以下6步:
(a)初始化神经网络参数、浓度设定值及调整趋势;
(b)神经网络预测浓度设定值调整趋势,更新粒子位置及速度;由神经网络函数预测硝态氮及溶解氧浓度设定值调整趋势,加权至标准粒子群算法位置与速度更新公式;
(c)全局最优作为硝态氮及溶解氧浓度设定值,计算出水品质及能耗适应度值,指导污水处理过程运行;
(d)若出水品质及能耗降低,则称为进步粒子,记录进步粒子的硝态氮及溶解氧浓度设定值及调整趋势,训练神经网络模型;
(e)神经网络模型评估与更新;训练完成后,对神经网络进行评估;评估过程中,仅保留惯性分量及神经网络预测分量,由神经网络粒子运行,获取浓度设定值;若新网络获得的出水品质及能耗均值优于前代网络,则保留新网络参数,用来指导预测优化步骤;
(f)判断是否满足结束条件,若不满足,返回步骤(b)继续进行。
2.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于:所述智能体四要素之状态为污水组分浓度。
3.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于:所述智能体四要素之环境为污水处理过程。
4.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于:所述智能体四要素之奖励由出水品质及总能耗组成;所述总能耗包括曝气能耗和泵送能耗。
5.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于:所述智能体四要素之行动为硝态氮及溶解氧浓度设定值调整策略。
6.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于:硝态氮及溶解氧浓度设定值采用粒子候选解描述,奖励采用适应度值描述,表示为出水品质、曝气能耗和泵送能耗的加权值,由下式表示:
f=c(Ea+Ep)+EQ
式中EQ为出水品质,采用向受纳水体排放出水污染物所需支付的罚款表示,Ea为曝气能耗,Ep为泵送能耗,c为曝气能耗与泵送能耗系数。
7.根据权利要求1所述基于强化学习粒子群算法的污水处理优化控制方法,其特征在于步骤(b)中标准粒子群算法位置与速度更新公式为:
xid(t+1)=xid(t)+vid(t+1)
式中:Xi=(xi1,xi2,…,xid,…,xiD)为粒子i的位置;Vi=(vi1,vi2,…,vid,…,viD)为粒子i的速度分量;Pi=(pi1,pi2,…,pid,…,piD)为粒子i的个体最优;而Pg=(pg1,pg2,…,pgd,…,pgD)为全局最优值;ω为惯性权重;c1和c2为学习因子,r1和r2为随机概率值;Vi_y=(vi1_y,vi2_y,…,vid_y,…,viD_y)为神经网络预测的浓度设定值调整趋势;k为神经网络模型预测系数;ωvid(t)为惯性分量;为预测分量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110081.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高火电厂全厂热效率的生产工艺
- 下一篇:一种铋基钙钛矿材料及其制备方法