[发明专利]一种具有负载均衡的车联网资源分配方法有效
申请号: | 202110665161.2 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113507503B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 胡斌杰;黄铮 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H04L67/1001 | 分类号: | H04L67/1001;H04L67/12 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 詹丽红 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 负载 均衡 联网 资源 分配 方法 | ||
1.一种具有负载均衡的车联网资源分配方法,其特征在于,所述资源分配方法包括以下步骤:
S1、构建V2I通信的车联网场景,所述车联网场景包括单个SDN控制器以及多个车辆、基站和MEC服务器,每个基站均配置一个MEC服务器,每个基站配置有限的通信资源,基站间通过光纤连接,车辆与基站间通过无线连接,所述车联网场景利用NFV技术对通信资源和计算资源进行虚拟化,根据车辆的时空分布,SDN控制器为MEC服务器配置有限的计算资源,并由SDN控制器集中控制通信资源和计算资源的联合分配,车辆具备V2I通信能力,其中,MEC表示移动边缘计算,NFV表示网络功能虚拟化,SDN表示软件定义网络,V2I表示车辆与基础设施;
S2、SDN控制器收集通信小区内基础设施与车辆的资源状态信息,作为DQN的输入状态,DQN以车辆与基础设施的连接状态作为输出动作,其中,DQN表示深度Q值网络,所述资源状态信息包括基站到车辆的下行速率、基站下行速率的使用占比、基站与车辆在上一子帧的奖励、MEC服务器到车辆的计算速率、MEC服务器计算速率的使用占比、MEC服务器与车辆在上一子帧的奖励以及车辆请求的任务大小,所述连接状态包括车辆与基站的连接、车辆与MEC服务器的连接;
S3、以车辆通信和计算卸载的负载均衡为优化目标,结合约束条件,建立最优化问题模型;
所述步骤S3中,为了实现车辆通信和计算卸载的负载均衡,需要最小化εbs(t)和εmec(t)的方差,同时最大化和定义子帧t时车辆u与基站k的历史连接情况为表达式如下:
车辆与基站间的负载均衡优化目标函数为:
其中,式(16)中第一项目标函数表示最小化基站为车辆提供的累积下行速率方差,式(16)中第二项目标函数表示最大化所有基站与车辆的整体下行速率,表示εbs(t)的均值,表达式如下:
定义子帧t时车辆u与MEC服务器m的历史连接情况为表达式如下:
车辆与MEC服务器间的负载均衡优化目标函数为:
其中,式(19)中第一项目标函数表示最小化MEC服务器为车辆提供的累积计算速率方差,式(19)中第二项目标函数表示最大化所有MEC服务器与车辆的整体计算速率,表示εmec(t)的均值,表达式如下:
根据所述车辆与基站间以及车辆与MEC服务器间的负载均衡目标函数,建立联合车辆通信和计算卸载的负载均衡最优化数学模型如下:
上述约束条件中,C1表示每一基站的通信资源约束条件;C2表示每一MEC服务器的计算资源约束条件;C3表示每一车辆在每个子帧最多只能连接到一个基站;C4表示每一车辆在每个子帧最多只能连接到一个MEC服务器;C5表示车辆与基站的连接行为,取值为0或1,当取值为1表示连接,当取值为0表示未连接;C6表示车辆与MEC服务器的连接行为,取值为0或1,当取值为1表示连接,当取值为0表示未连接;
S4、根据最优化问题模型,设计DQN奖励函数和DQN神经网络结构;所述步骤S4过程如下:
S4.1、设计DQN奖励函数如下:
在子帧t时车辆u接入基站k的奖励函数为表达式如下:
上式中,当时,表示车辆u与基站k在子帧t之前存在过历史连接;当时,表示车辆u与基站k在子帧t之前未曾连接过,此时车辆u接入基站k的资源使用占比越小,则对应的奖励越大,否则,车辆u接入基站k的资源使用占比越大,对应的奖励越小;
在子帧t时车辆u接入MEC服务器m的奖励函数为表达式如下:
上式中,当时,表示车辆u与MEC服务器m在子帧t之前存在过历史连接;当时,表示车辆u与MEC服务器m在子帧t之前未曾连接过,此时车辆u接入MEC服务器m的资源使用占比越小,则对应的奖励越大,否则,车辆u接入MEC服务器m的资源使用占比越大,对应的奖励越小;
联合奖励函数和并与上一子帧的奖励和作差,从而计算出当前动作作用于环境后的联合奖励,车辆u在子帧t时的联合奖励函数为ru(t),表达式如下:
S4.2、设计DQN网络结构,其中,DQN的网络输入的维度为[1,H,W],其中,1表示通道数,H表示高,W表示宽,先通过4层卷积层逐步提取输入状态的特征,然后经过通道注意力模块来对特征通道进行加权,之后用两个全连接层分别对加权后的输出做特征选择,最后作相加融合得到各个输出动作的Q值;
S5、通过步骤S4中设计得到的DQN神经网络结构,提取输入状态的特征,拟合Q表的状态动作函数,得到各种输入状态下输出动作的Q值,并结合奖励函数训练和更新神经网络;
S6、利用DQN进行推理时,根据输入状态,SDN控制器输出相应的动作Q值序列,将Q值最大的动作作为车辆通信和计算卸载的策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110665161.2/1.html,转载请声明来源钻瓜专利网。