[发明专利]基于自适应网络编码的异构无线链路并发传输控制方法有效
申请号: | 202110784463.1 | 申请日: | 2021-07-12 |
公开(公告)号: | CN113490239B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 朱晓荣;王伟;赵夙 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04W28/22 | 分类号: | H04W28/22 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陈月菊 |
地址: | 210046*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自适应 网络 编码 无线 并发 传输 控制 方法 | ||
1.一种基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,所述控制方法包括以下步骤:
S1,基于A3C构建自适应编码决策模型,定义A3C强化学习参数,强化学习参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数;
S2,对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R,N和R均是大于1的整数值;
S3,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;
S4,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中;
步骤S1中,所述定义模型参数的过程包括以下步骤:
S11,设定路径状态集St为:
St={Bwt,Buffert,(N,R),T,Tt,Plt}
式中,Bwt={Bwt,1,Bwt,2,...,Bwt,I},Bwt,i表示t时刻路径i的带宽大小,I表示链路总数;Buffert表示t时刻视频缓存,(N,R)表示过去时刻选择的编码分组大小N和R;T表示当前分组传输时延;Tt={Tt,1,Tt,2…,Tt,I},Tt,i表示t时刻路径i的下载时延;Plt={Plt,1,Plt,2,...,Plt,I},Plt,i表示t时刻路径i的丢包率,1≤i≤I;
S12,设定动作集at为:
at={N,R}
式中,N表示编码分组大小,R表示分组内冗余数据包大小,N和R都是整数值;
S13,定义状态转移概率
S14,定义奖励函数rt:
式中,表示最大化吞吐量,其中Bwt,i表示t时刻路径i的带宽大小;α是重新缓冲的惩罚因子,rebuf表示重新缓冲的时间;β表示时延惩罚因子,T=MAX(Tt,i)(1≤i≤I)表示总的下载时延;γ表示缓冲区惩罚因子,
B1,B2是缓冲区上下限阈值,θ为缓冲区调节因子,0≤θ≤1;
步骤S2中,对全局代理的神经网络参数θc和θa进行迭代优化的过程包括:
S201,输入全局代理的神经网络参数θc和θa、全局最大的迭代次数M,令全局迭代次数m=1;
S202,初始化时间t=0;
S203,初始化起始状态st=s0;初始化神经网络参数增量dθc=0,dθa=0;将全局代理的神经网络参数赋值给局部代理θ′c=θc,θ′a=θa;s0表示t=0时的网络状态;
S204,设t=1;
S205,基于策略π(at|st;θ′a),执行动作at,从视频播放环境中获得奖励值rt和新的状态st+1;
S206,令t=t+1,m=m+1;重复步骤S205,直至t=N+1;
S207,计算状态sN的值函数
S208,令i=N-1;
S209,更新θa的增量更新θc的增量式中,表示优势函数,即运用策略π(θa)所获奖励与预期奖励的差值;H(.)表示正则化熵值,以保证决策代理充分地探索环境空间,γ表示折扣因子,0<γ<1;
S210,令i=i-1,重复步骤S209,直至i=0;
S211,更新全局代理的网络参数θa←θa+wdθa,θc←θc-αdθc;其中,w表示Actor网络的更新步长,a表示Critic网络的更新步长;
S212,令m=m+1,重复步骤S23至S211,直至m>M,输出迭代后的网络参数θc和θa。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110784463.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柴油车用小型液体属性检测仪
- 下一篇:一种焦化废水分离系统