[发明专利]一种联盟链上物流机器人联合路径规划方法有效
申请号: | 202011592153.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112581026B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 吴琛;谢杨洁;张帅;胡麦芳;张珂杰;詹士潇;汪小益;黄方蕾;蔡亮;李伟;邱炜伟 | 申请(专利权)人: | 杭州趣链科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/08;G06N3/04;G06N3/08 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 谢秀娟 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联盟 物流 机器人 联合 路径 规划 方法 | ||
1.一种联盟链上物流机器人联合路径规划方法,其特征在于,包括以下步骤:
S1、构建参与训练的物流机器人节点,并根据节点形成联盟链;
S2、构建参与训练的物流机器人节点的策略模型π并进行初始化,获取物流机器人节点的行动方案c及信息f;
所述行动方案c包括包裹的投递顺序和预设定的行动路线;
所述投递顺序采用向量表示;所述预设定的行动路线采用坐标集合表示;
所述信息f包括需要投递的包裹数量,包裹的投递信息;
所述包裹的投递信息包括地址坐标及投递接收人信息;
S3、对其中一个物流机器人的节点的策略模型π进行训练,并求解模型在信息f下的最优行动方案c及神经网络参数θ并上传至联盟链中;
策略模型π表示在t步骤时,处于信息f下做出行动方案c的概率,具体为:
其中:θ为神经网络的训练参数;为t步骤时采取的行动方案、信息和神经网络训练参数;
S4、根据最优行动方案c及神经网络参数θ对其他物流机器人节点的神经网络参数进行更新并发送到其他物流机器人节点;根据更新后的神经网络参数对策略模型π进行分析,具体过程为:根据更新后的神经网络参数判断模型是否达到训练要求,若是,则结束训练;若不是,则继续进行更新;所述更新具体包括:将所述步骤S3的机器人节点得到的神经网络参数θ作为其他节点模型的输入参数,得到其他机器人节点行动方案;根据其他节点行动方案计算具体完成当前物流运送任务的时间;采用物流运送任务时间与根据其他机器人节点神经网络参数计算得到的任务时间得到得分s,具体为:,其中:σ为得分调整参数,取值范围为1~10;对得分s进行判断,若得分s的均值达到设定的阈值则该节点的当前参数有效并进行更新;完成物流机器人路径规划;
所述训练要求采用耐心系数获取,具体过程为:根据耐心系数值得到训练次数,并根据训练次数对物流机器人进行训练;如果某次训练获得的行动时间大于上一次获得的行动时间则训练次数减1,如果某次训练获得的行动时间小于上一次获得的行动时间则将训练次数重置;当训练次数为0时则结束训练;训练结束后,选取得到行动时间最短的某次训练的参数作为模型的训练要求。
2.根据权利要求1所述的联盟链上物流机器人联合路径规划方法,其特征在于,所述步骤S3的具体过程为:将当前时刻的信息和神经网络的训练参数作为策略模型π的输入参数得到最优行动方案c;神经网络的训练参数θ进行更新,得到更新后的神经网络参数θ。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州趣链科技有限公司,未经杭州趣链科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592153.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理