[发明专利]环境不确定遥感卫星网络下的智能资源联合调度方法有效
申请号: | 202011251365.3 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112422171B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 周笛;王怡昕;盛敏;李建东;吴家鑫;戴诺伊;王晨光;白卫岗 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04B7/185 | 分类号: | H04B7/185;H04L12/24;H04W24/02;H04W24/06;H04W28/16;H04W72/04 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 环境 不确定 遥感 卫星网络 智能 资源 联合 调度 方法 | ||
1.一种环境不确定遥感卫星网络下的智能资源联合调度方法,其特征在于,建立的网络模型适用于遥感卫星网络所处环境和其资源调度场景,通过强化学习避免了直接求解高复杂度的规划问题和状态空间连续、无限的难题,包括有如下步骤:
(1)建立环境不确定的遥感卫星网络模型:首先确定遥感卫星网络规模及参数,包括遥感卫星和地面站的个数及位置,接着定义遥感卫星网络状态集S、动作集A、奖励R、动作价值函数所述状态集S={B×D×H×EH},在第i时隙开始时刻,遥感卫星网络的状态Si包括电池现有电量Bi,数据缓冲区现有数据量Di,信道参数Hi和吸收太阳能量四部分;根据ITU-R P.618-13、ITU-R P.838和ITU-R P.839建议书的标准,建立星地、星间链路的动态信道模型,仿真获得信道参数Hi;考虑卫星运转的轨道特性,建立动态能量收集模型,仿真获得吸收太阳能量所述动作集A={Ar×At}包括接收功率{Ar}和发送功率{At}两部分,可分别表示为和其中,δ表示步长,0表示不接收或不发送数据,PMAX表示功率最大值,当传输链路为星地链路时,否则,所述奖励R以卫星在时隙初始时刻发送的数据量表示;所述动作价值函数的含义是智能体以策略π为指导,在状态Si下,执行动作Pi后,获得回报的期望;完成环境不确定的遥感卫星网络模型的建立;
(2)产生环境参数的数据:通过STK软件仿真遥感卫星网络模型导出一个拓扑周期内环境参数的原始数据,并通过MATLAB软件处理以上原始数据,获得链路通断、链路连接时长、遥感卫星的位置以及每时隙位于阳面时长,上述数据作为智能资源联合调度方法的环境参数数据;
(3)初始化智能资源联合调度方法所需参数:智能资源联合调度方法所需参数包括有,一周期的时隙数T,星载电池容量Bmax,电池容量门限Bmin,数据存储器容量Dmax,静态功耗Pcons,单位时隙长度τ,探索率ε,Critic网络参数ωcritic,Actor网络参数ωactor,学习率α,Critic网络参数的更新间隔Tcopy,Actor网络参数的更新间隔Ttrain,训练总时隙数I,当前时隙数i,折扣因子γ;
(4)指导卫星进行功率分配:观察状态Si,基于每一可行动作,通过定义反映遥感卫星工作特性及环境影响的六维特征函数,提取状态、动作对的特征向量fi(Si,Pi),结合Actor网络参数ωactor,使用ε-greedy策略在可行动作集中选择一动作Pi作为当前时隙的功率分配方案,指导卫星进行功率分配;
(5)遥感卫星网络状态预转移:计算环境不确定的遥感卫星网络模型中的奖励Ri,判断是否完成迭代:i=I,若是,则转至步骤(10),否则,进行下一步,执行新一轮迭代;
(6)指导卫星进行功率预分配:观察预状态S′i,基于每一可行动作,通过定义反映遥感卫星工作特性及环境影响的六维特征函数,提取状态、动作对的特征向量f′i(S′i,Pi′),结合Actor网络参数ωactor,使用ε-greedy策略在可行动作集中选择一动作Pi′作为下一时隙预选的功率分配方案,并把样本(fi,Pi,Ri,fi′,Pi′)放入经验存储器,用于后续网络参数更新;
(7)Critic网络参数ωcritic更新判断:对当前时隙数i和Critic网络参数的更新间隔Tcopy进行取余运算,判断取余运算结果是否满足i%Tcopy=0,若是,则按照ωcritic=ωactor的规则来更新Critic网络参数ωcritic,进行下一步,否则,直接进行下一步;
(8)Actor网络参数ωactor更新判断:对当前时隙数i和Actor网络参数的更新间隔Ttrain进行取余运算,判断取余运算结果是否满足i%Ttrain=0,若是,则根据梯度下降策略来更新Actor网络参数ωactor,进行下一步,否则,直接进行下一步;
(9)更新遥感卫星网络的状态、动作和当前时隙数:Si+1=S′i,Pi+1=Pi′,i=i+1,完成一次迭代,接着转至步骤(5);
(10)得到指导联合调度的网络参数ωcritic:输出通过环境不确定遥感卫星网络下的智能资源联合调度方法训练得到的网络参数ωcritic,环境不确定遥感卫星网络下的智能资源联合调度方法结束;在实际应用中,基于此参数,根据greedy策略,即ε=0下的ε-greedy策略,产生资源联合调度方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011251365.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钻孔分层充填方法
- 下一篇:一种五金加工用板材切割装置