[发明专利]一种基于深度强化学习的计算卸载调度方法在审
申请号: | 201811143682.6 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109257429A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 葛季栋;李传艺;潘林轩;杨诗宇;谢凯航;陈书玉;王帅惟;骆斌 | 申请(专利权)人: | 南京大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于深度强化学习的计算卸载调度方法,为物联网设备提供了一种计算卸载作出卸载决策方法,包括针对计算卸载的基本模型,对需要卸载的各个方面进行决策。基于不同的优化目标,通过改变价值函数,以达到不同的优化目标。本算法中的Deep‑SARSA算法相似于DQN算法是结合强化学习与深度学习的深度强化学习算法,在配合了经验池可以有效的将卸载状态与卸载动作转变为深度学习的可训练样本。本发明能够有效的对不限维度的卸载状态模型进行机器学习,降低学习的复杂度,该方法使用神经网络作为Q值得线性逼近器,可以有效的提高训练速度,减少训练所需要的样本,该方法能有效的在既定模型和优化目标下,通过深度强化学习,作出最优的决策。 | ||
搜索关键词: | 卸载 强化学习 优化目标 算法 卸载状态 样本 强化学习算法 调度 物联网设备 方法使用 基本模型 机器学习 价值函数 神经网络 线性逼近 卸载决策 复杂度 可训练 维度 学习 决策 配合 | ||
【主权项】:
1.本发明所述的一种基于深度强化学习的计算卸载调度方法,其特征在于包涵以下步骤:步骤(1)建立计算卸载模型。步骤(2)样本的获取与分组。步骤(3)初始化神经网络参数。步骤(4)发现初始状态并选择初始动作作为当前动作。步骤(5)执行当前动作,发现下一个状态和即时回报。步骤(6)执行经验回放过程。步骤(7)选择下一个动作。步骤(8)计算并优化损失函数并更新CNN参数。步骤(9)将下一个动作作为当前动作,并跳转回步骤(5)直至本组样本耗尽。步骤(10)跳转回步骤(4)进入下一组样本直至所有样本耗尽。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811143682.6/,转载请声明来源钻瓜专利网。