首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种使用深度强化学习进行移动边缘计算的任务迁移方法有效

申请号：	201910672308.3	申请日：	2019-07-24
公开（公告）号：	CN110347495B	公开（公告）日：	2023-04-28
发明（设计）人：	张成;古博;马良	申请（专利权）人：	张成
主分类号：	G06F9/48	分类号：	G06F9/48;G06N3/092;G06N3/084;G06N7/01
代理公司：	佛山市海融科创知识产权代理事务所(普通合伙) 44377	代理人：	陈志超;唐敏珊
地址：	201612 上海市松江***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种使用深度强化学习进行移动边缘计算任务迁移方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种使用深度强化学习进行移动边缘计算的任务迁移方法，其特征在于，具体包括以下步骤：

步骤S1：设定系统模型各参数，包括以下步骤：

步骤S11：定义边缘计算服务基站位置集合为；

步骤S12：定义服务时间片段集合为；

步骤S13：在t时刻，，定义用户连接的服务基站位置为；

步骤S14：定义t时刻距离用户最近的服务基站位置为；

步骤S15：定义式1为两基站的距离；

步骤S2：采用马尔可夫决策过程描述强化学习中的决策公式，决策的智能体为装载于用户终端的一种云计算控制装置，该云计算控制装置可决定是否进行任务迁移，包括以下步骤：

步骤S21：定义t时刻智能体的状态为式2，为用户当前使用基站与考虑任务迁移基站的距离之差；

步骤S22：定义智能体的动作集合为式3，代表不做任务迁移，代表进行任务迁移；

步骤S23：定义t时刻智能体的动作为式4；

步骤S24：定义t时刻服务质量函数为式5；其中意为用户在t时刻获得的服务质量；D代表了当前使用基站正好离用户最近的情况下的服务质量，即；而λ为一常数，衡量了对服务质量的影响程度；

步骤S25：定义t时刻代价函数为式6，其中，代表了任务迁移时产生的时间能量等消耗，其与距离有关，代价函数代表了智能体不同动作所需付出的代价；

步骤S26：定义t时刻奖励函数式7；

步骤S27：定义t时刻的决策动作为式8，意为状态下智能体做出的动作函数；

步骤S28：定义t时刻决策动作后的状态为；

步骤S29：定义所有时刻的集合为；

步骤S210：定义最佳决策下所有时刻奖励函数的最大值为式9，其中代表折扣因子；

步骤S211：利用时间差分算法使系统探索最优决策，由贝尔曼方程可得迭代公式为式10；

步骤S212：利用Q学习方法可得到最优Q值式11；

步骤S3：基于公式给出任务迁移算法，包括以下步骤：

步骤S31：引入评估参数，使得最优Q值式12，其中代表贝尔曼方程中的可调参数；

步骤S32：更换得到迭代优化目标函数为式13，其中代表上一次迭代的值；

步骤S33：得到代价函数为式14，对式14微分处理后得到代价函数梯度为式15；

步骤S34：得到参数迭代方程为式16，其中，代表学习率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于张成，未经张成许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910672308.3/1.html，转载请声明来源钻瓜专利网。

上一篇：上下文信息管理方法、装置、系统及计算机可读存储介质
下一篇：资源处理调度方法、装置、计算机设备和存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top