[发明专利]一种基于强化学习的多次级用户移动边缘计算的方法有效
申请号: | 201811597091.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109803292B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 葛颂阳;肖亮;龚杰;陈翔 | 申请(专利权)人: | 佛山市顺德区中山大学研究院;广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;H04W72/04;H04W72/10 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 左恒峰 |
地址: | 528399 广东省佛山市顺德区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 多次 用户 移动 边缘 计算 方法 | ||
1.一种基于强化学习的多次级用户的移动边缘计算方法,其特征在于,所述计算方法包括下列步骤:
S1、系统初始化参数,确定主级用户的个数NP,次级用户的个数NS,边缘服务器的个数以及控制节点的个数NM,次级用户的发射功率P,次级用户的任务量为Task,每一个次级用户与边缘服务器之间信道的信道容量C,通信紧急度Em为零;初始化方法参数,边缘服务器所对应的信道的状态初始为未占用,值为零,初始化Q值均为零,学习速率为α,折现因子为δ,优先级函数值为零,优先级阈值为θ,且优先级队列为空,开始迭代;
S2、主级用户选择占用边缘服务器MP,该服务器的状态值为1;
S3、次级用户i根据ε-贪婪策略提出占用边缘服务器资源的申请Mi1,并且确定计算卸载的任务量x;
S4、控制中心处理各次级用户的申请,并且为其分配边缘服务器;
S5、获得边缘服务器资源的次级用户实现卸载计算,未获得占用资格的次级用户,则进行完全本地计算;
S6、计算各次级用户当前效用作为即时回报,并将即时回报和成功连接的边缘服务器更新至优先级模型中;
S7、更新通信紧急度,且更新Q值和优先级函数,若优先级函数高于阈值θ,则将此状态和选择加入优先级队列中,并按照优先级顺序更新相应的Q值;
S8、判断是否满足迭代终止条件,若满足,则计算整个方法执行后各次级用户平均效用;若不满足,则跳转至步骤S2;
所述步骤S7具体包括:
S71、更新通信度主要是根据次级用户是否成功获得边缘服务器资源决定,若次级用户成功占用原申请服务器,则其通信紧急度保持不变;若次级用户仅可使用非原申请边缘服务器,则Em+1;若次级用户并未获得服务器的资源,仅能完全本地计算,那么其Em+2;
S72、更新Q值为,将以学习速率α学习到的未来折扣回报与当前Q值之间的误差,即预测误差,叠加至当前Q值之上;更新优先级函数为,取预测误差和当前优先级函数值的最大值作为新的优先级函数值。
2.根据权利要求1所述的一种基于强化学习的多次级用户的移动边缘计算方法,其特征在于,所述步骤S4具体包括:
S41、控制中心将各个次级用户的申请进行处理;
S42、若边缘服务器所对应的信道状态为1,则申请该服务器的次级用户不可获得使用权,跳转到步骤S44;
S43、若一个边缘服务器仅被申请一次,则该边缘服务器由所申请的次级用户占用,即成功占用原申请服务器;
S44、若边缘服务器被申请两次及以上,则根据各个次级用户的通信紧急度进行排序,通信紧急度较高的优先获得边缘服务器的使用权,即占用非原申请服务器资源;
S45、未获得边缘服务器使用权的次级用户,则被随机分配未被申请的边缘服务器,保证所有的边缘服务器均被占用或者次级用户均获得服务器资源;若存在边缘服务器已占满,部分次级用户未获得服务器资源,那么次级用户只能进行完全本地计算。
3.根据权利要求1所述的一种基于强化学习的多次级用户的移动边缘计算方法,其特征在于,所述步骤S6具体包括:
S61、各次级用户的效用性包含两个部分,主要有计算的延时和计算的能耗,与效用性成反比;
S62、进行本地计算的次级用户的效用值中,包含本地计算延时和本地计算能耗;进行计算部分卸载的次级用户的效用值中,包含本地计算延时、本地计算能耗、卸载时延和卸载能耗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市顺德区中山大学研究院;广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学,未经佛山市顺德区中山大学研究院;广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811597091.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于水声传感器网络的健壮拓扑生成方法
- 下一篇:一种数据传输方法及装置