[发明专利]一种区分业务的自学习异构无线网络接入选择方法有效
申请号: | 201711133779.4 | 申请日: | 2017-11-16 |
公开(公告)号: | CN107889195B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 韩萌;苏俭 | 申请(专利权)人: | 电子科技大学 |
主分类号: | H04W48/18 | 分类号: | H04W48/18 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种区分业务的自学习异构无线网络接入选择方法,属于无线网络接入选择技术领域。当移动终端业务到来时,本发明通过接入选择管理器为终端业务接入一个合适的无线网络,不仅能够满足终端的各类业务需求,该方法综合考虑网络服务质量和用户体验,针对不同类型的业务采用不同的接入选择准则,通过赌博机模型的自学习机制,在不中断通信的情况下反映网络状态信息的动态变化,及时调整接入选择。 | ||
搜索关键词: | 一种 区分 业务 自学习 无线网络 接入 选择 方法 | ||
【主权项】:
一种区分业务的自学习异构无线网络接入选择方法,其特征在于,包括下列步骤:步骤1:设置各无线接入点节点信息,并发送给接入选择管理器,所述节点信息包括:网络服务质量属性参数的上下门限、可捕获的终端的移动速度上下门限和网络接入成本;步骤2:无线接入点收到来自终端的终端业务请求后,将所述终端业务请求和所述无线接入节点下的当前网络的服务质量参数一同发送给接入选择处理器;所述终端业务请求包括:终端的可用网络集合、终端的移动速度、业务类型;步骤3:接入选择处理器按接收顺序对收到的终端业务请求进行最优网络选择,确定当前最优稳定网络策略:301:确定当前决策最优网络:为当前终端业务请求中的业务类型选择当前最优接入网络:若对应业务类型的已处理数量Ts(i)小于系统的网络总数M,则顺序接入当前终端业务请求至终端的可用网络集合中未接入过的网络;否则分别根据公式计算当前决策时,终端的可用网络集合中各网络被选中概率pm(i),取pm(i)最大的网络作为当前终端业务请求的接入网络;其中m为网络标识符,i为当前决策次数,s为业务类型标识符,表示上一决策时将业务类型为s的终端业务请求接入网络m的回报均值,其中首次决策时,上一决策时的回报均值为预设值,e为自然底数,T为表示预置的温度系数;302:确定当前最优稳定网络策略:基于当前业务类型s所对应的最优接入网络,在接入策略集中匹配对应的接入策略,得到当前决策的接入策略θ,所述接入策略为业务类型与网络标识符的映射关系,并为每个接入策略设置唯一索引符;对各接入策略θ的回报均值μθ进行遍历,将最大回报均值μθ对应的接入策略θ作为当前决策的最优稳定网络策略θ*,其中回报均值μθ为1×K维的矩阵,K表示业务类型数,即回报均值μθ的列矢量为不同业务类型的回报均值μθ(s),且μθ(s)的初始值为预设值;步骤4:接入选择管理器根据当前最优接入网络计算当前决策的总回报值r(i):分别基于当前最优接入网络,计算终端的移动速度、网络服务质量属性参数和网络接入成本的当前归一化回报值,再对各归一化回报值进行加权求和得到当前决策的总回报值r(i);其中归一化回报值的计算公式为:其中am网络m的接入选择结果,且am∈{0,1},0表示未接入网络m,1表示接入网络m,a=(a1,a2,…,aM)T,上标T表示转置符号,m=1,2,…,M;fζ,m表示对应参量ζ的回报函数,其中参量ζ表示终端的移动速度、网络服务质量属性参数或网络成本,当ζ表示网络成本时,fζ,m为对应网络m的网络接入成本;当ζ表示终端的移动速度时,若终端的移动速度在移动速度上下门限区间范围以内,则fζ,m为第一速度预设值;否则fζ,m为第二速度预设值,且第一速度预设值大于第二速度预设值;当ζ表示网络服务质量属性参数时,基于网络服务质量属性参数的上下门限将网络服务质量属性参数的取值区间分为三段,并为各段设定对应的取值,基于当前最优接入网络的网络服务质量属性参数的取值所属的取值区间,得到对应fζ,m值;步骤5:接入选择处理器更新相关统计信息:更新当前业务类型s的已处理数量Ts(i);更新当前业务类型s接入网络m的次数Tm,s(i);更新当前业务类型s接入网络m的回报均值更新方式为:其中首次决策时,上一决策时的回报均值为预设值;更新当前业务类型s对应的接入策略θ的回报均值μθ,即更新μθ(s)为:μθ(s)=[μθ(s)*Tp(idx)+r(i)]/(Tp(idx)+1),Tp(idx)表示接入策略θ的接入次数,其中idx为接入策略θ的索引符;更新接入策略θ的决策次数Tp(idx)为:Tp(idx)=Tp(idx)+1;更新记录业务类型的序列Tst,将第i次决策的业务类型Tst(i)设置为当前业务类型s;步骤6:计算当前决策的总后悔值其中,μ*(Tps(t))表示第t次决策的最优稳定网络策略θ*的回报均值中的业务类型s的回报均值;判断最近两次决策的总后悔值的插值是否小于预设门限,若是,则将当前最优稳定网络策略θ*作为无线网络接入选择处理结构;否则,继续执行步骤步骤3。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711133779.4/,转载请声明来源钻瓜专利网。