[发明专利]基于值函数近似的超密集异构网络小站编码协作缓存方法有效

申请号：	201811634918.6	申请日：	2018-12-29
公开（公告）号：	CN109617991B	公开（公告）日：	2021-03-30
发明（设计）人：	潘志文;高深;刘楠;尤肖虎	申请（专利权）人：	东南大学
主分类号：	H04L29/08	分类号：	H04L29/08;H04W28/14
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	施昊
地址：	210096 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于函数似的密集网络小站编码协作缓存方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于值函数近似的超密集异构网络小站编码协作缓存方法，其特征在于：将宏基站及其覆盖范围内的小站作为机器，宏基站负责决定每个时隙状态下小站要执行的动作并下达给各小站，各小站负责执行动作，所述状态包括本时隙的文件流行度和前一时隙做出的协作缓存决策，所述动作是指本时隙做出的为下一时隙文件请求服务协作缓存决策；采用值函数近似的强化学习方法，将值函数表达为状态和动作的函数，以最大化平均累积小站直接服务的文件请求数目为优化目标，通过不断地与环境交互，适应环境的动态变化，挖掘出潜在的文件请求转移模式，得到值函数的近似式，进而得到与文件请求转移模式相匹配的协作缓存决策；宏基站对协作缓存决策进行编码，并将编码协作缓存结果传达给各小站；

包括以下步骤：

步骤1、采集网络信息，设置参数：

采集网络中的宏基站集合M、小站集合P、文件请求集合C₁以及第m个宏基站覆盖范围内的小站数目p_m,m∈M；获得小站缓存空间K，运营商根据网络运行情况和硬件成本确定站缓存空间K；运营商根据超密集异构网络中的文件请求情况将一天时间划分为T个时隙，并设置每个时隙的时间起点，根据发生时间先后将每个时隙划分为三个阶段：文件传输阶段、信息交换阶段和缓存决策阶段；

步骤2、制定基于MDS编码的基站协作缓存方案：

将小站的协作缓存决策向量记为a(t)，a(t)中的每个元素a_c(t)∈[0,1]，c∈C₁，代表在第t时隙小站缓存第c个文件的比例，a_c(t)≠0的文件集合即是t时隙缓存的文件集合，记为C'(t)，第c个文件包含B个信息比特，第m个宏基站通过MDS编码把B个信息比特编码生成个校验比特：

上式中，d是接收信号功率大于一个阈值的小站的个数，阈值由运营商根据网络运行情况确定，所有个校验比特分为小站候选比特和宏基站候选比特两部分，其中小站候选比特包含p_mB个比特，即每个小站有互不重复的B个候选比特，在t时隙每个小站从各自的候选比特中选择前a_c(t)B个比特进行缓存；宏基站从其候选比特中任意选取(1-da_c(t))B个比特进行缓存，根据MDS编码性质，一次文件请求获得至少B个校验比特就能够恢复整个文件；

步骤3、制定基站协作传输方案：

用户的每次文件请求首先从覆盖它的d个小站获得da_c(t)B个比特，若da_c(t)≥1，则宏基站不需再传输数据；否则宏基站从d个小站中选择距离用户最近的一个小站，传输(1-da_c(t))B个比特给该小站，然后由该小站把这些比特传输给用户，宏基站传输的数据称为回程链路负载；

步骤4、用马尔科夫决策过程MDP来描述强化学习任务：

建立强化学习四元组其中X代表状态空间，A代表动作空间，代表状态转移概率，在x状态下执行动作a转移到x′状态的概率，代表该转移带来的奖赏；

强化学习四元组具体形式如下：

动作空间：由于缓存决策向量包含的元素个数等于集合C₁的元素个数C，因此动作空间是C维连续空间，把每维a_c(t)量化成L个离散值，L由运营商根据宏站计算能力确定，则离散化的动作空间为A＝{a¹,a²,…,a^|A|}，其中任意一个动作向量j∈{1,2,…,|A|}需满足条件：满足该条件的动作向量总个数为|A|，第t时隙的缓存决策a(t)∈A；

状态空间：在第t时隙，第m个宏站覆盖范围内的p_m个小站文件请求总次数记为向量N(t)＝[N₁(t),N₂(t),…,N_C(t)]，总文件流行度记为向量Θ(t)＝[θ₁(t),θ₂(t),…,θ_C(t)]，其中那么第t时隙的状态记为x(t)＝[Θ(t),a(t-1)]；令H＝{Θ¹,Θ²,…,Θ^|H|}为总文件流行度集合，Θ(t)经量化后即为集合H中的一个元素，则状态空间记为X＝{x¹,x²,…,x^|H||A|}，状态x(t)∈X；