[发明专利]基于深度强化学习的动态环境下的最大化系统效益方法在审

专利信息
申请号: 201910741705.1 申请日: 2019-08-13
公开(公告)号: CN110428115A 公开(公告)日: 2019-11-08
发明(设计)人: 刘倩;丁冉;邢志超;吴平阳;赵熙唯;李骏;桂林卿 申请(专利权)人: 南京理工大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06N3/08
代理公司: 江苏楼沈律师事务所 32254 代理人: 沈勇
地址: 210094 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明设计了一种基于深度强化学习的移动边缘计算架构下为动态用户提供低延时高可靠的计算服务的无人机路径规划方法。考虑无人驾驶飞机具有便捷的基础设施,且可在偏远或灾难区域快速搭建通信渠道,也可架栽计算资源为终端移动用户提供服务,因此考虑将无人机当作移动计算服务器,在终端移动用户的上方为其提供高效的交互服务。本发明考虑到终端用户的实时移动,将其建模成高斯‑马尔科夫移动模型,再通过对用户位置状态、无人机位置状态、无人机电池量状态以及无人机与用户之间的信道状态进行建模,结合深度强化学习算法规划无人机路径最大化系统长期效益。
搜索关键词: 强化学习 终端移动 最大化 建模 无人驾驶飞机 强化学习算法 动态环境 动态用户 基础设施 计算服务 计算资源 交互服务 路径规划 实时移动 通信渠道 位置状态 系统效益 信道状态 移动计算 移动模型 用户提供 用户位置 灾难区域 终端用户 低延时 电池量 高可靠 高斯 服务器 架构 移动 规划 服务
【主权项】:
1.基于深度强化学习的动态环境下的最大化系统效益方法,其特征在于:考虑终端用户的实时移动性,将其建模成高斯‑马尔科夫移动模型,合理考虑终端用户的实时移动,在此基础上考虑无人机路径规划问题为其提供计算服务,考虑用户端的相对公平性和无人机的能量约束,无人机在每个时隙所做出的决策都合理分配自身的能量在满足用户公平性的前提下服务用户,从而最大化系统长期奖励。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910741705.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top