[发明专利]基于Q-learning的工业互联网机器设备用户数据计算卸载决策方法有效

专利信息
申请号: 201910633257.3 申请日: 2019-07-15
公开(公告)号: CN110351754B 公开(公告)日: 2022-05-24
发明(设计)人: 李萌;杨乐;张延华;吴文君;杨睿哲;孙阳 申请(专利权)人: 北京工业大学
主分类号: H04W24/02 分类号: H04W24/02;H04W24/06
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 learning 工业 互联网 机器设备 用户 数据 计算 卸载 决策 方法
【权利要求书】:

1.基于Q-learning的工业互联网机器设备用户数据计算卸载决策方法,其特点在于:在某个通信小区中,存在N个用户、M个WiFi节点和1个部署了MEC服务器的基站,当已知小区内用户数、WiFi节点数和优化目标后,根据实际情况配置网络模型、时延模型、能耗模型和经济开销模型中的环境参数,并构造Q-learning中的状态、卸载动作和奖励函数,随后依据优化目标设置权值参数进行Q-learning迭代,学习到不同网络和服务器环境下用户计算任务的最佳处理方式,获得相应优化目标的Q表,最后根据优化目标选择对应的训练完成的Q表,以此为指导执行最优策略,从而达到此环境下用户计算任务处理的最低总开销,具体依次按以下步骤实现:

步骤(1),系统初始化,根据实际情况有:

小区内包含有N个有卸载需求的用户,用户每隔时间t产生计算任务,且任务的数据量为d,复杂度为c,小区内还存在1个部署了MEC服务器的基站,和M个WiFi节点供连接,MEC服务器的最大负载为L,用户从移动网络获得的带宽和传输功率分别为Bb和pb,从WiFi网络获得的带宽和传输功率分别为Bw和pw

步骤(2),根据用户计算卸载的网络模型、时延模型、能耗模型和经济开销模型,结合实际情况,设置各模型中的参数,并计算在卸载过程中每种卸载决策产生的时延、能耗和经济开销;

步骤(3),根据步骤(2)中构造完成的网络模型、时延模型、能耗模型和经济开销模型,并结合优化场景,设置Q-learning中的状态、动作和奖励函数;

步骤(4),根据优化目标和权值参数范围设置权值参数,若进行全局优化,权值参数Wd、We、Wm均设为若进行补偿优化,补偿目标的权值参数设为0.8,其余权值参数均设为0.1;0≤Wd≤1、0≤We≤1、0≤Wm≤1、Wd+We+Wm=1;

步骤(5),根据步骤(4)中设置的权值参数和Q-learning迭代公式,训练不同优化目标的Q表,Q表是一张负责记录Q-learning中状态-动作值简称Q值的表格,其结构如下:

其中,(a1,a2...am...aM)为所有可选择的卸载动作,(s1,s2...sn...sN)为所有可能出现的状态,Q(s1,a1)表示在状态s1下执行动作a1的数值,在初始状态下,Q表中的Q值均为0,当系统执行卸载动作时,致使环境跳变至下一状态,并从环境中获得奖励,随后将根据获得的即时奖励和跳变状态对Q值进行数值迭代,其迭代公式表示为:

Q(s,a)←Q(s,a)+α[r+γmaxQ(s’,a’)-Q(s,a)]

其中,Q(s,a)表示在状态s下做动作a时的Q值;α为学习效率,影响Q表的更新速度;r为即时奖励,γ为奖励延迟,maxQ(s’,a’)表示下一状态中可选动作中的最大Q值;

步骤(6),根据不同的优化目标选择步骤(5)中对应的训练完成的Q表,并按照选定Q表执行该场景下的最优卸载策略,在按照Q表执行策略时,系统将会选择每个状态下Q值最大的动作作为该状态下的最优动作,直至执行指令结束;

步骤(2) 的实施过程如下,

步骤(2.1),当用户数为m时,计算用户与基站间的网络传输速率rb和用户与WiFi节点间的网络传输速rw率,分别表示为:

其中,hb和hw分别为移动网络和WiFi网络的信道增益,Nb和Nw分别为移动网络和WiFi网络中噪声的功率谱密度;

步骤(2.2),分别计算用户在本地处理任务和卸载处理任务产生的时延,当用户选择在本地处理任务时,任务时延Dl表示为:

Fl为用户本地CPU的计算速度;

当用户选择卸载处理任务时,分为通过移动网络/WiFi网络上传任务至MEC服务器/云服务器,任务时延分别表示为:

其中,Fl为用户本地CPU的计算速度,Fom为MEC服务器的计算速度,为云服务器的计算速度,tc任务上传至云服务器的额外等待时间,为用户连接基站上传任务至MEC服务器处理产生的时延,为用户连接基站上传任务至云服务器处理产生的时延,为用户连接WiFi节点上传任务至MEC服务器处理产生的时延,为用户连接WiFi节点上传任务至云服务器处理产生的时延;

步骤(2.3),分别计算用户在本地处理任务和卸载处理任务产生的能耗,当用户选择在本地处理任务时,总能耗El表示为:

El=zn·c

其中,zn为CPU每轮处理过程消耗的能量,zn表示为:

zn=10-27·(Fl)2

当用户择卸载处理任务时,分为通过移动网络/WiFi网络上传任务至MEC服务器/云服务器,其总能耗分别表示为:

其中,ps为用户待机时延;为用户连接基站上传任务至MEC服务器处理产生的能耗,为用户连接基站上传任务至云服务器处理产生的能耗,为用户连接WiFi节点上传任务至MEC服务器处理产生的能耗,为用户连接WiFi节点上传任务至云服务器处理产生的能耗;

步骤(2.4),分别计算用户在本地处理任务和卸载处理任务产生的经济开销,当用户选择在本地处理任务时,其经济开销Ml为0,当用户选择卸载任务时,分为通过移动网络/WiFi网络上传任务至MEC服务器/云服务器,其经济开销分别表示为:

其中,Mb为运营商收取的单位移动数据流量费用,为MEC服务器收取的单位数据量存储费用,为MEC服务器收取的单位计算费用,为云服务器收取的单位数据量存储费用,是云服务器收取的单位计算费用,为用户连接基站上传任务至MEC服务器处理产生的经济开销,为用户连接基站上传任务至云服务器处理产生的经济开销,为用户连接WiFi节点上传任务至MEC服务器处理产生的经济开销,为用户连接WiFi节点上传任务至云服务器处理产生的经济开销;

步骤(3) 的实施过程如下,

步骤(3.1),根据小区内用户数,设置状态集合:

其中,为用户n与选定WiFi节点间的网络传输速率,为用户n与基站间的网络传输速率,L为MEC服务器的计算资源占有情况;

步骤(3.2),根据小区内用户数,设置动作集合:

其中,表示用户n的任务是否上传,表示用户n与WiFi节点或是基站连接,表示用户n的计算任务上传至MEC服务器或是云服务器进行处理;

步骤(3.3),根据步骤(2)中网络模型、时延模型、能耗模型和经济开销模型,获得每一时刻小区内用户任务处理的总开销,分为任务本地处理总开销和通过移动网络/WiFi上传任务至MEC服务器/云服务器的总开销,分别表示为:

Al=Wd·Dl+We·El+Wm·Ml

其中,Wd、We、Wm分别为用户处理任务时对应于时延、能耗和经济开销的权值,且服从0≤Wd≤1、0≤We≤1、0≤Wm≤1和Wd+We+Wm=1,Al为用户在本地处理任务产生的加权总开销,为用户连接基站上传任务至MEC服务器处理产生的加权总开,为用户连接基站上传任务至云服务器处理产生的加权总开销,为用户连接WiFi节点上传任务至MEC服务器处理产生的加权总开销,为用户连接WiFi节点上传任务至云服务器处理产生的加权总开销;

奖励函数rt表示为:

其中,Alocal(t)为时刻t下所有用户任务都置于本地处理的总开销,A(st,at)为时刻t时状态st下做出动作at产生的总开销。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910633257.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top