首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于强化学习的污水处理控制方法有效

申请号：	201811026163.1	申请日：	2018-09-04
公开（公告）号：	CN109324508B	公开（公告）日：	2021-06-08
发明（设计）人：	黄孝平;文芳一;黄文哲	申请（专利权）人：	南宁学院
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	贵州派腾知识产权代理有限公司 52114	代理人：	谷庆红
地址：	530200 广西***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习污水处理控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于强化学习的污水处理控制方法，其特征在于：包括如下步骤：

1).模型训练：在现场控制器控制的过程中，获取现场控制器的输入信号及输出指令，并根据获取的输入信号及N个时序前的输出指令对环境模型建模；

2).策略调整：在现场控制器控制的过程中，获取现场控制器的输入信号至环境模型，环境模型输出作为策略模型的输入，将现场控制器的输出指令和策略模型的输出指令合并为最终输出指令输出控制；

3).介入控制：停止现场控制器，采用环境模型获取输入、环境模型输出作为策略模型的输入、策略模型输出指令进行控制；

所述步骤2)中，策略模型采用如下方式更新：

a.获取当前环境模型输出，计算当前环境模型输出与前一模拟输出的误差值；

b.根据误差值更新值函数；

c.将当前环境模型输出代入至值函数中计算当前输出指令值；

d.将当前输出指令值代入至环境模型中计算当前模拟输出；

e.当前模拟输出更新至前一模拟输出，将当前输出指令发送，然后进入下一时序，等待获取环境模型输出。

2.如权利要求1所述的基于强化学习的污水处理控制方法，其特征在于：所述对环境模型建模采用RNN算法。

3.如权利要求1所述的基于强化学习的污水处理控制方法，其特征在于：所述环境模型输出为概率值向量。

4.如权利要求1所述的基于强化学习的污水处理控制方法，其特征在于：所述步骤2)中，将现场控制器的输出指令和策略模型的输出指令合并为最终输出指令采用如下方式：

a.获取现场控制器的输出指令和策略模型的输出指令；

b.将现场控制器的输出指令和策略模型的输出指令中的数值取出为现场控制器输出指令数值和策略模型输出指令数值；

c.将策略模型输出指令数值乘以系数N后更新为新的策略模型输出指令数值；

d.将现场控制器输出指令数值乘以系数(1-N)后更新为新的现场控制器输出指令数值；

e.将新的现场控制器输出指令数值和新的策略模型输出指令数值叠加得到输出指令叠加值；

f.将输出指令叠加值封装为输出指令发送指令。

5.如权利要求4所述的基于强化学习的污水处理控制方法，其特征在于：所述N为0.1～0.2。

6.如权利要求4所述的基于强化学习的污水处理控制方法，其特征在于：所述N初始为0.1，每经过M次将现场控制器的输出指令和策略模型的输出指令合并为最终输出指令的步骤后，N自加0.005直到N为0.2。

7.如权利要求6所述的基于强化学习的污水处理控制方法，其特征在于：所述M取值由用户设定，但限定为10～30。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南宁学院，未经南宁学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811026163.1/1.html，转载请声明来源钻瓜专利网。

上一篇：针对隐身目标动态RCS的雷达发射功率自适应控制方法
下一篇：信息调控方法、装置及系统

同类专利

专利分类

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top