[发明专利]一种基于强化学习的超启发算法的车辆路径优化方法有效
申请号: | 201911116073.6 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110956311B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张景玲;冯勤炳;余孟凡 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/047 | 分类号: | G06Q10/047;G06N3/006;G06Q10/0835 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 启发 算法 车辆 路径 优化 方法 | ||
一种基于强化学习的超启发算法的车辆路径优化方法,包括以下步骤:步骤1车辆路径问题分析;步骤2初始化;步骤3经验池、序列池存储;步骤4解的接受保留;步骤5判断经验池容量,容量足够则进入步骤8学习,未满,则进入步骤6;步骤6选择Action;步骤7保留最优解;步骤8选择学习样本,并初始化神经网络;步骤9神经网络学习更新;步骤10更新目标值网络;步骤11判断学习结束情况,学习未结束,则进入步骤8继续学习更新;反之,则进入步骤6选择Action,返回主循环;步骤12程序结束,输出车辆路径距离最优值及最优值路径序列。本发明提供了一种高层选择策略为强化学习的超启发算法的车辆路径优化方法。
技术领域
本发明涉及一种物流配送、电子商务、智能优化、计算机应用领域,尤其涉及的是一种车辆路径优化方法。
背景技术
车辆路径问题是一个NP-Hard问题,求解最优解相对困难。现有的车辆路径优化方法,包括精确算法,传统启发式算法和智能算法。精确算法,例如:分支定界法,最小化K-trees,动态规划算法等,能求得全局最优解,但是当客户点规模扩大时,求解时间呈指数增长。传统启发式算法,例如节约法,两阶段法等,相较于精确算法,能够更加有效地找寻最优解,但同样在大规模问题上,效率不佳。智能算法,例如蚁群算法,遗传算法,禁忌搜索算法等,因其既能得到优解,又能保证效率的优点,得到许多研究者青睐。但对传统智能算法的设计,设计者往往需要同时具备计算机算法设计基础以及所需解决问题领域的专业知识,缺乏通用性。近年来,超启发算法因其高效性和通用性的特点,被提出来用于解决跨领域的组合优化问题。同时,人工智能的发展,也使强化学习算法越来越受人关注,其在多种领域的表现尤为亮眼。
发明内容
为了保证算法在求解VRP问题上具有通用性的要求,同时达到利用强化学习算法根据结果优化超启发算法的选择策略,提升算法性能的目的,本发明提出了一种高层策略可移植的基于强化学习的超启发式算法的车辆路径优化方法。
本发明解决其技术问题所采用的技术方案是:
一种基于强化学习的超启发算法的车辆路径优化方法,所述方法包括以下步骤:
步骤1车辆路径问题分析,采用Augerat’s instances数据集,车辆路径问题的成本矩阵的元素是欧几里得距离;
假定配送中心设为i=0,客户点设为L(i=1,2,3,…,L),最多车辆数设为K(k=1,2,3,…K),每辆车具有相同载重量为q,每个客户点需求量设为di(i=1,2,3,…,L),客户i到客户j的距离设为cij,优化的目标是行驶距离最短,一个完整的解包含了全部路径的集合;
步骤2初始化,先生成Npop组个体的种群,得到最小路径k,利用聚类思想划分,k块区域,得KC块,由KC块随机挑选生成可行解组P(pi=p1,p2,p3,…,pNP),计算种群适应度f(fi=f1,f2,f3,…,fNP);随机挑选一组可行解pi以及对应适应度值fi,设PB为最优解个体,FB为最优适应度值,设LLH算子数量为NA,Action取值为(1,2,3,…,NA)整数,初始化PB=pi,FB=fi,State=0,Action=random(NA),随机挑选一个范围NA中的数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911116073.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动间距下液遥控船
- 下一篇:一种防抖群组、防抖镜头和摄像装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理