[发明专利]一种基于贝叶斯学习的端到端网络资源分配方法在审
申请号: | 202111306962.6 | 申请日: | 2021-11-05 |
公开(公告)号: | CN113966004A | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 李大鹏;柳晓寒;朱天林;蒋锐;王小明;徐友云 | 申请(专利权)人: | 南京邮电大学;南京南邮通信网络产业研究院有限公司 |
主分类号: | H04W72/04 | 分类号: | H04W72/04;G06F17/18;G06Q10/04;G06Q30/02 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 熊玉玮 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 学习 端到端 网络资源 分配 方法 | ||
1.一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,根据服务商在常规阶段的预期效用值和服务商在激励阶段的预期效用值相等的约束下确定运营商在常规阶段的最优定价,取服务商在激励阶段的预期效用极大值处的定价为运营商在激励阶段的最优定价,求解运营商响应最优定价且获得最优效益时服务商所采取的最优阈值策略,根据服务商所采取的最优阈值策略更新服务商在常规阶段到达系统的泊松速率以及服务商在激励阶段到达系统的泊松速率,根据更新后的服务商在常规阶段到达系统的泊松速率计算服务商在常规阶段的网络资源请求量,根据更新后的服务商在激励阶段到达系统的泊松速率计算服务商在激励阶段的网络资源请求量。
2.根据权利要求1所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,所述服务商在常规阶段的预期效用值根据表达式计算,其中,为服务商j在常规阶段T1的预期效用值,vj为服务商j对一单位网络资源的估价,p1为常规阶段T1一单位网络资源的价格,为服务商j在常规阶段T1获取到一单位网络资源的可能性,λ1为服务商在常规阶段T1到达系统的泊松速率,λ1=Λ(1-θ),Λ服从参数为α和β的先验伽马分布,为常规阶段T1每单位网络资源平均分配给y+1个服务商的概率的期望值,Q为初始网络资源数量。
3.根据权利要求2所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,所述服务商在激励阶段的预期效用值根据表达式计算,其中,为服务商j在激励阶段T2的预期效用值,[0.8vj-p2(θ,x)]+表示[0.8vj-p2(θ,x)]≥0时才有意义,p2(θ,x)为激励阶段T2一单位网络资源价格关于θ、x的函数,θ为服务商所采取的阈值策略,x为服务商在常规阶段T1请求的网络资源数量,为服务商j在激励阶段T2获取到一单位网络资源的可能性,λ2是在服务商在激励阶段T2到达系统的泊松速率,p2是激励阶段T2更新后的一单位网络资源的价格。
4.根据权利要求3所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,所述服务商在激励阶段的预期效用极大值的求解方法为:令运营商在激励阶段T2的效益函数的一阶导数为零。
5.根据权利要求4所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,求解运营商响应最优定价且获得最优效益时服务商所采取的最优阈值策略的方法为:
依据表达式求解运营商响应最优定价时的最优效益,为运营商在常规阶段的最优定价,为运营商在激励阶段的最优定价;
依据表达式θ*=argmaxθπR(Q)求解运营商响应最优定价且获得最优效益时服务商所采取的最优阈值策略,θ*为运营商响应最优定价且获得最优效益时服务商所采取的最优阈值策略。
6.根据权利要求5所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,根据更新后的服务商在常规阶段到达系统的泊松速率计算服务商在常规阶段的网络资源请求量的表达式为:P(N1=k)为服务商在常规阶段T1的网络资源请求量N1为k的概率。
7.根据权利要求5所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,根据更新后的服务商在激励阶段到达系统的泊松速率计算服务商在激励阶段的网络资源请求量的表达式为:P(N2=k)为服务商在激励阶段T2的网络资源请求量N2为k的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学;南京南邮通信网络产业研究院有限公司,未经南京邮电大学;南京南邮通信网络产业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111306962.6/1.html,转载请声明来源钻瓜专利网。