[发明专利]基于深度强化学习的无人车充电路径规划方法在审
申请号: | 202210302308.6 | 申请日: | 2022-03-25 |
公开(公告)号: | CN114676909A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 傅忱忱;郜正轩;吴巍炜;吕妍;周頴豪;徐学永;夏羽 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06Q50/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 无人 充电 路径 规划 方法 | ||
本发明设计了一种利用深度强化学习模型Graph Attention based Pointer Network(GAPN)为无线传感器网络中的无人车向传感器节点进行充电的路径规划方法。流程包括如下步骤:(1)收集无线传感网络中每个节点的位置坐标信息及其电量状况(2)根据收集的数据生成与其位置信息相同分布的训练数据集和测试数据集;(3)将制作好的数据集用于GAPN模型训练;(4)将收集到的节点信息输入到完成训练的GAPN模型中,通过模型的处理,输出最终的访问节点序列。本发明基于深度强化学习和图神经网络的方法提出了一种解决无人充电车路径规划的策略,提高了无线传感网络的工作效率,延长了网络的生命周期。
技术领域
本发明属于机器学习应用领域,具体涉及模型搭建与训练,通过实际问题的解决效果来反应模型的优劣,尤其涉及基于深度强化学习的无人充电车路径规划方法。
背景技术
在大多数无线传感器网络中,每个传感器节点都是固定部署在一个位置,并且通过电池设备或者依靠环境能源,例如风能、太阳能等进行供给电量,但是这样的能源供给存在不可控性和不稳定性,无线传感网工作效率以及稳定性也受到了极大的影响,网络的生命周期也大大降低。
为了解决传统无线传感器网络的能量供给问题,利用移动设备对传感器节点进行补充电量的方案成为研究的热点。这样的充电方式实际上是基于移动性节点的思想提出的,引入移动性节点的可以提高网络的灵活性,为传感器网中的多种任务,例如传感器节点电量补充、数据收集、目标跟踪和节点定位等提供了新的思路,极大提高了传感器网络的容错率,延长了传感器网络的生命周期。为了让充电车能够合理选择需要补充能量的传感器节点,平衡节点之间的能量损耗,更加有效地执行充电任务,避免网络中出现因电量不足而出现的节点“死亡”现象,需要对充电车进行有效调度以及合理的路径规划。
路径规划问题是经典的组合优化问题之一,近些年来,研究表明深度学习和强化学习在解决组合优化问题上有独特的优势。基于深度强化学习的模型通常将问题转化到高维空间中,在高维空间中寻找并学习变量之间存在的关系,并结合图神经网络对于图结构的处理,获取到问题的最优解,这是传统运筹学方法所无法做到的。所以,如何设计神经网络的框架结构和损失函数,优化模型的训练过程,是目前深度强化学习解决组合优化问题的技术难点。
发明内容
本发明所要解决的技术问题在于,在考虑节点位置、耗电速率、充电速率以及节点电量容量等限制条件情况下,为充电车设计合理的节点充电路径规划方案,避免无线传感网络中的节点出现电量不足而导致的“死亡现象”,并且尽可能减少无人车所消耗的路径成本,从而延长无线传感网络的生命周期,提高网络可用性。
本发明的技术方案是:
基于深度强化学习的无人充电车路径规划方法,包括如下步骤:
步骤(1)收集无线传感网络中的节点S={s0,s1,s2,…,sn}信息,包含节点的位置信息和紧急状况;
步骤(2)搭建基于深度强化学习的模型GAPN,包含点编码器、图编码器、解码器以及注意力机制模块;
步骤(3)以搜集到节点信息数据为基础,生成训练数据集和测试数据集用于训练GAPN模型;
步骤(4)设定模型训练目标为最小化节点死亡率以及最小化充电车路径成本,定义损失函数,使用强化学习actor-critic算法对GAPN进行训练,得到最终的模型;
步骤(5)将无线传感网络中的节点S={s0,s1,s2,…,sn}信息输入到GAPN模型中,模型返回充电车访问所有节点的方案π={s0,s′1,s′2,…,s′n},其中π是对S的重新排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210302308.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理