[发明专利]一种通过动态调度无人终端最小化感知数据获取时延方法有效
申请号: | 202011613662.8 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112867023B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 刘驰;戴子彭 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04W16/22 | 分类号: | H04W16/22;H04W24/02;H04W56/00;H04W72/12 |
代理公司: | 北京中海智圣知识产权代理有限公司 11282 | 代理人: | 杨树芬 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 动态 调度 无人 终端 最小化 感知 数据 获取 方法 | ||
1.一种通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,包括:
步骤1、基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延;
步骤2、基站开启子进程模拟无人终端轨迹数据获取时延上传至分布式优先经验复用池;
步骤3、基站基于分布式优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹;
步骤301、基站判断分布式优先经验复用池是否收集10%存储空间的经验数据,当不满足时,各子进程还需要采用异步执行方式获取10%存储空间的经验数据;
步骤302、当分布式优先经验复用池存在满足10%空间的经验数据,分布式优先级经验复用池中依照现有的优先级w采样出批量经验数据;
步骤303、基站的主进程根据批量经验数据,按照第一计算模型计算当前最佳动作第一计算模型如下式(1):
上式(1)中,为满足0到0.25间的均匀分布的一个随机乘子,为价值采样,G为采样次数,argmax表示选取期望值最大的向量元素操作;
步骤304、基站将当前最佳动作发送至仿真环境中的无人终端,无人终端根据当前最佳动作更新到下一个局面状态st+1,基站的主进程按照第一计算模型计算下一最佳动作
步骤305、基站的主进程根据当前局面状态st、本次移动和数据获取动作at、以及下一个局面状态st+1、下一最佳动作按照第二模型计算误差矩阵TD的各个元素TDij,第二计算模型如下式(2):
上式(2)中,TDij为误差矩阵TD的各个元素,rt为当前局面奖励,为当前局面分布的独立均匀采样,为下一个局面分布的独立均匀采样,γ为衰减因子;
步骤306、基站的主进程通过第三计算模型的梯度下降法更新参数,第三计算模型如下式(3):
上式(3)中,为目标函数,Huber为组合数学中常用的分位数误差计算函数;
步骤307、基站的主进程通过误差矩阵TD的各个元素TDij和第四计算模型更新优先级经验复用池的优先级wt,第四计算模型如下式(4):
上式(4)中,wmin为给定的优先级下限;
步骤308、基站的主进程初始化仿真环境,并基于优化后的优先级经验复用池的优先级wt输出无人终端每一步的最佳动作,在无人终端执行完T步动作时,输出该动作序列,该序列为可最小化当前环境感知数据获取时延的最优轨迹;
步骤4、基站向无人终端发送最优轨迹动态调动指令获取感知区域内传感器的最新数据。
2.根据权利要求1所述的通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,步骤1所述基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延包括:
在移动群智感知技术场景的基站上建立一个空的分布式优先级经验复用池,然后建立多个子进程,并初始化各子进程中仿真环境的参数,其中,仿真环境的参数包括无人终端位置、无人终端电量、传感器位置和各传感器的数据获取时延。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011613662.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:间歇定量高粘度生物制剂喷涂枪
- 下一篇:一种比例控制的安全阀泄压方法及装置