[发明专利]一种移动区块链中智能资源分配方法在审
申请号: | 202010263998.X | 申请日: | 2020-04-07 |
公开(公告)号: | CN111565420A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 宁兆龙;孙守铭;王小洁;张凯源;董沛然 | 申请(专利权)人: | 大连理工大学 |
主分类号: | H04W28/16 | 分类号: | H04W28/16;H04W28/20;H04W28/22;H04L12/24;G06N20/00;G06N3/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 区块 智能 资源 分配 方法 | ||
1.一种移动区块链中智能资源分配方法,其特征在于,步骤如下:
步骤1):通过区块链和移动边缘计算技术建立用于在移动设备交易过程中保护其隐私和数据安全的移动区块链框架;该框架包含三个模块:移动区块链模块、任务卸载模块和决策制定模块;
1.1)移动区块链模块设计
移动区块链模块由移动设备组成;在移动区块链模块中,每个移动设备都配置区块链应用并且它们之间直接地进行交易不需要第三方机构参与;每个移动设备作为区块链中的矿工,随时地参与挖矿从而获得成功挖矿的奖励;
1.2)任务卸载模块设计
在挖矿过程中将挖矿任务即工作量证明卸载到其附近的小基站;小基站部署移动边缘计算服务器,并且每个小基站需要为向其请求服务的移动设备分配有限的算力和带宽;最后每个小基站需要立即将挖矿任务的计算结果返回给设备;
1.3)决策制定模块设计
决策制定模块中包含一个控制器;该控制器与各个小基站交互并且收集所有小基站以及其所连设备的信息,具体包括每个小基站的总算力、总带宽以及其连接的所有设备的挖矿任务信息;最后,控制器为每个小基站制定最佳的带宽和算力分配策略并立即将分配策略发送给各个小基站;
步骤2):对系统中设备的效用进行建模,并建立小基站带宽以及算力资源联合分配模型;
2.1)抽象设备的效用
小基站的信道是有限状态的马尔可夫信道,并且当在决策时期k时,当设备n向小基站m上传挖矿任务时的信道信号噪声比为SNRn,m(k);当设备n从小基站m下载挖矿任务结果时的信道信号噪声比为SNRm,n(k);
设备n向小基站m上传挖矿任务的速率为:
其中,bn,m是小基站m为设备n分配的带宽;
设备n从小基站m下载挖矿任务结果的速率为:
其中,bn是设备n的带宽;
设备n向小基站m上传挖矿任务的时间为:
其中,Dn是设备n的挖矿任务的数据大小;
设备n从小基站m下载挖矿任务结果的时间为:
其中,In是设备n的挖矿任务结果的数据大小;
设备n的挖矿任务在小基站m上的处理时间为:
其中,Yn是完成设备n的挖矿任务所需要的CPU周期数,fn,m是小基站m为设备n分配的算力;
设备n的挖矿时间为:
设备n的挖矿成本为:
其中,∈是单位能量所对应的成本,En是设备n的发射功率,pn,m是设备n对小基站m上的移动边缘计算服务器的单位时间租赁成本;
设备n成功求解其挖矿任务,即PoW难题的概率为:
其中,α和β分别是设备分配的算力和带宽对其求解挖矿任务重要性,M是小基站的数量,Nm是将挖矿任务卸载到小基站m的移动设备的数量,fj,i(k)和bj,i(k)分别是在决策时期k时小基站i为设备j分配的算力和带宽;
假设区块链中成功挖矿服从均值为t0的泊松分布,则设备n挖出的块由于广播时间过长而成为孤儿块的概率为:
其中,Ni是将挖矿任务卸载到小基站i的设备数量,是区块链中所有的设备数量,φ是与广播时间有关的常数参数,是块的广播时间;
设备n成功挖矿的概率为:
Hn,m(k)=δn,m(k)(1-θn,m)
设备n的挖矿奖励为:
其中,是挖矿的固定奖励,ηDn是挖矿的可变奖励,η是可变奖励中的常数参数,Dn是设备n的挖矿任务的数据大小,也就是块的大小;
设备n挖矿的效用为:
Un,m(k)=Rn,m(k)-Cn,m(k)
2.2)建立小基站带宽以及算力资源联合分配模型
为了最大化所有移动设备长期的挖矿效用,小基站带宽以及算力资源联合分配模型如下:
P:
s.t.C1:
C2:
C3:
C4:
C5:
其中,是决策变量,即所有设备分配的带宽集合和算力集合;K是决策时期的最大数量;
C1保证每个小基站为设备分配的算力总和不超过其总算力,其中是所有小基站集合,是小基站m的总算力;
C2保证每个小基站为设备分配的带宽总和不超过其总带宽,其中是小基站m的总带宽;
C3保证每个设备的挖矿成本不超过其挖矿预算,其中是将挖矿任务卸载到小基站m的所有设备的集合,Gn是设备n用于挖矿的预算;
C4保证区块链的吞吐量不低于其下限,其中l是平均每个交易的数据大小,是从上个成功挖出的块开始,设备n开始参与挖矿的时间间隔,Ω是区块链吞吐量的下限;
C5保证每个设备的挖矿任务都是由一个小基站完成,即在挖矿的过程中不存在小基站的切换,其中dn,m是设备n距小基站m的距离,vn是设备n的移动速度,ρn,m是设备n的移动方向与设备到小基站的向量之间的夹角,ω是小基站的通信范围半径;
步骤3):将步骤2)中的联合分配模型分解为两个子模型,分别为带宽分配子模型和算力分配子模型;
分解得到带宽分配子模型:
P1:
s.t.P中C2约束.
分解得到算力分配子模型:
P2:
s.t.P中C1,C3,C4,C5约束.
步骤4):设计深度强化学习与粒子群优化结合方法求解步骤3)中P1和P2子模型;
Step1:将P1进一步分解为多个子问题,每个小基站分别需要求解一个子问题,对于小基站m其需要解决的子问题为:
P3
其中,通过对所有小基站子问题进行求解从而解得P1并获得所有设备的带宽分配;
Step2:控制器收集系统状态Sk并输入到深度确定性策略梯度方法中的演员网络来获得该状态所对应的动作Ak;其中,系统状态Sk包含每个小基站的状态即M是小基站的数量;每个小基站的状态定义如下:
其中,Tn=(Dn,Yn,Gn,In)是设备n卸载的挖矿任务,Dn是挖矿任务的数据大小,Yn是完成设备n的挖矿任务所需要的CPU周期数,Gn是设备n用于挖矿的预算,In是挖矿任务计算结果的数据大小,dn,m是设备n到小基站m的距离,ρn,m是设备n的移动方向与设备n到小基站m的向量之间的夹角,vn是设备n的移动速度,SNRn,m和SNRm,n分别是设备n上传挖矿任务和下载挖矿任务结果时信道的信号噪声比,和分别是小基站m的总算力和总带宽,Nm是将挖矿任务卸载到小基站m的移动设备的数量;
输出的动作Ak包含每个小基站的算力分配决策am,即Ak={am|m=1,...,M};每个小基站的算力分配决策am定义如下:
am={fn,m|n=1,...,Nm,fn,m∈[fmin,fmax]}
其中,fn,m是小基站m为设备n分配的算力,fmin和fmax分别是小基站为设备分配的算力的下界和上界;
Step3:产生0-1之间的随机数θ,如果θ大于等于贪婪策略中的参数∈,则输出动作Ak;否则如果随机探索中采用粒子群优化的概率ζ小于等于∈,则使用粒子群优化产生的改进动作替换动作Ak;否则使用随机动作替换动作Ak;
Step4:执行动作Ak,获得奖励Rk以及系统下一状态Sk+1,并将四元组(Sk,Ak,Rk,Sk+1)保存在深度确定性策略梯度算法中的经验回放缓存中;其中,奖励Rk定义如下:
其中,λ是一个常数参数;
Step5:定期地从经验回放缓存中选择小批次样本训练深度确定性策略梯度网络,并更新其演员在线网络和评论家在线网络的参数;
Step6:定期地使用‘软’更新策略来更新演员目标网络和评论家目标网络的参数;
Step7:在每次迭代中重复执行K次Step1-Step6,直到算法达到最大的迭代次数,输出每个设备分配的算力和带宽资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010263998.X/1.html,转载请声明来源钻瓜专利网。