[发明专利]一种基于强化学习的分布式消息系统参数自适应优化方法有效

专利信息
申请号: 202110417493.9 申请日: 2021-04-19
公开(公告)号: CN113132482B 公开(公告)日: 2022-10-14
发明(设计)人: 谢在鹏;夏明尧;朱晓瑞;唐斌 申请(专利权)人: 河海大学
主分类号: H04L67/10 分类号: H04L67/10;H04L67/562;H04L67/306;H04L41/14;G06N3/08;H04L41/0823
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 成立珍
地址: 210024 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 强化 学习 分布式 消息 系统 参数 自适应 优化 方法
【权利要求书】:

1.一种分布式消息系统参数自适应优化方法,其特征在于:包括如下步骤:

步骤1:根据消息中间件的官方配置文档获取消息中间件中影响性能的n个参数;

步骤2:生成训练样本数据集Ts;

步骤3:使用一位有效编码对训练样本数据集Ts进行预处理,处理的结果使得离散型和连续型参数的取值类型统一转换为数值型,形成标准训练样本数据集St;

步骤4:对标准训练样本数据集St进行降维;

步骤5:利用Lasso回归算法对标准训练样本数据集St进行迭代计算,获得n个参数的权重集合Ws,然后根据权重集合Ws对n个参数进行进一步筛选出一个关键参数集合Kp;

步骤6:根据筛选得到的关键参数集合Kp及其权重建立初步的性能预测模型;根据消息中间件的官方配置文档获取关键参数集合Kp中参数之间具有相关性的参数集合Cp,在参数集合Cp中比较具有相关性的参数之间的权重大小,删除权重值小的参数,建立最终的性能预测模型,其最终关键参数集合为Kx;

步骤7:利用最终的性能预测模型中的最终关键参数集合Kx构建一个基于策略梯度的强化学习方法的DDPG参数优化模型;

步骤8:对步骤7的参数优化模型进行迭代训练并输出调优结果,该结果给出了当前环境下的优化参数配置;

所述的步骤8具体包括如下步骤:

步骤8.1)将最终关键参数集合Kx内的关键参数以默认值在AIoT网络环境中的分布式消息系统中配置运行,获得分布式消息系统当前的吞吐量,将其设为状态序列的初始状态S0并得到它的特征向量φ(S0);

步骤8.2)当t<F时,t表示当前迭代次数,F表示最大迭代次数,在Actor网络中,输入当前状态St,St表示第t步的状态,得到基于当前状态St的动作At=πθ(φ(St))+N,N表示初始化随机噪音函数,πθ(φ(St))表示根据当前状态St对其特征向量φ(St)采取的策略;

步骤8.3)执行动作At,即根据At改变当前参数配置,得到新的状态St+1,根据新的状态St+1和前一步状态St得到执行动作At而获得的当前奖励Rt,观察新的状态St+1,得到其特征向量φ(St+1);

步骤8.4)将四元组{φ(St),At,Rt,φ(St+1)}存入到经验回放池表D;

步骤8.5)根据奖励判断当前状态,如果奖励为1,则将当前状态更新为St+1,t更新为t+1,否则当前状态不变;

步骤8.6)从经验回放池表D中随机采集批量梯度下降的样本数m个,分别为{φ(Sj),Aj,Rj,φ(Sj+1)},j∈m,φ(Sj)表示m个随机采集批量梯度下降的样本中第j个批量梯度下降的样本的特征向量,Aj表示其采取的动作,Rj表示执行动作Aj获得的奖励,φ(Sj+1)表示执行动作Aj后下一步的状态的特征向量;设置当前的Critic目标网络值为yj=Rj+γQ′(φ(Sj+1),πθ′(φ(Sj+1))|ω′),γ表示衰退因子,Q′(φ(Sj+1))表示Critic目标网络,ω′表示Critic目标网络的参数,πθ′(φ(Sj+1))表示Critic目标网络对φ(Sj+1)执行的策略;

步骤8.7)使用神经网络的梯度下降方法的反向传播最小化参数ω的均方差的损失函数以此更新Critic网络的参数ω;

步骤8.8)通过梯度上升方法最大化参数θ的目标函数的梯度μ(Sj)表示当前策略(Actor)网络函数对Sj执行的策略,以此更新Actor网络的参数θ;

步骤8.9)当t%C=1时,C表示Critic目标网络迭代频率,此处%是取余计算,更新Critic目标网络的参数ω′和Actor目标网络的参数θ′:ω′←τω+(1-τ)ω′,θ′←τθ+(1-τ)θ′,τ表示软更新系数;

步骤8.10)如果达到最大迭代次数F,则迭代停止;否则转到步骤8.2);

步骤8.11)迭代完毕后,输出最终动作AF中参数的配置数据,该数据是当前环境下的优化参数配置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110417493.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top