[发明专利]一种物流机器人动态任务分配方法及系统有效
申请号: | 202110319717.2 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113044458B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 唐恒亮;王安琪;薛菲;曹阳 | 申请(专利权)人: | 北京物资学院 |
主分类号: | B65G1/04 | 分类号: | B65G1/04;B65G1/137 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 蔡永波 |
地址: | 101149 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物流 机器人 动态 任务 分配 方法 系统 | ||
1.一种物流机器人动态任务分配方法,其特征在于,包括:
选取仓库已经处理完毕的某一时段的所有订单,根据订单数量,订单内各任务所对应的货架,货架所在的货格的位置,运输货架的物流机器人数量、速度,接收货架的拣选台数量、位置,将物流机器人运输货架的路径和时间代价简化为物流机器人与目标位置的曼哈顿距离,其中,目标位置是指货架和/或拣选台;以及,基于马尔可夫决策过程,根据订单数量,订单内各任务所对应的货架,货架所在的货格的位置,运输货架的物流机器人数量、速度,接收货架的拣选台数量、位置和大小,构建物流机器人动态任务分配模型;构建所述物流机器人动态任务分配模型采用将订单分配给拣选台、将分配给拣选台的订单分解成独立任务、将每个独立任务分配到物流机器人的任务分配方式;
采用优化的蒙特卡洛搜索树算法对物流机器人动态任务分配模型进行训练求解,使得得到的解为物流机器人分配相应的一个或多个任务、且被分配任务的所有物流机器人完成所有货架拣选的总成本最优,得到最优物流机器人动态任务分配模型;所述最优物流机器人动态任务分配模型,能够将新收到的订单分配给拣选台,将每个拣选台的订单分解成独立的任务,将每个任务分配到物流机器人,物流机器人根据为其分配的任务所对应的货架运输到拣选台,在拣选台拣选完成后将相应的货架运回原位;
在仓库接收到订单并根据订单拣选货物时,采用最优物流机器人动态任务分配模型将新收到的订单分配给拣选台、将每个拣选台的订单分解成独立任务、将每个独立任务分配到物流机器人;物流机器人将其被分配的任务所对应的货架运输到拣选台,在拣选台拣选完成后将货架运回原位;
所述采用优化的蒙特卡洛搜索树算法对物流机器人动态任务分配模型进行训练求解,具体包括:
物流机器人动态任务分配模型包括为拣选台设置的状态转移方程:P(st,at,st+1)=1,通过对状态转移方程进行演变,得到所有拣选台的最大化动作序列A1,A2,...,An;所述所有拣选台的最大化动作序列则为物流机器人动态任务分配模型的求解结果;其中,s1,s2,...,sterminal分别表示拣选台的任务分配连续状态,st表示拣选台的第t个状态,sterminal表示拣选台的终止状态;at表示拣选台的状态由st转变到st+1是所选的动作;A1表示拣选台1的动作序列,A2表示拣选台2的动作序列,每个拣选台的动作序列为a1,a2,...,an,n就是动作次数;
对状态转移方程进行演变包括如下3步:
第1步:构建拣选台的初始状态s1和拣选台的终止状态sterminal的n×S矩阵;其中,n是指n个拣选台,S是指所有拣选台的动作序列数量;
第2步:将拣选台的状态由st演变为st+1:st~st+1,设定拣选台访问订单的次数阈值;当拣选台的当前状态st节点访问次数N(st)<P时,使用启发式规则为拣选台选择动作,将订单分配给相应的拣选台;当N(st)>P时,根据优化的蒙特卡洛搜索树算法对动作序列At进行收益Q(st,at)评估,根据评估结果选出动作at,将订单分配给动作at所对应的拣选台,状态更新完毕,更新至状态st+1;其中,Q表示动作at的收益评估,当前状态st节点是指拣选台当前的工作状态,动作是指将订单选择拣选台;优化的蒙特卡洛搜索树算法是指在传统蒙特卡洛搜索树算法节点选择中加入节点收益的幅度,以对传统蒙特卡洛搜索树算法进行优化;
第3步:如果拣选台演变后的状态不等于终止状态:st+1≠sterminal,重复执行第2步直至终止状态sterminal;
所述物流机器人动态任务分配模型还包括为物流机器人设置的状态转移方程,所述为物流机器人设置的状态转移方程是指在拣选台每进行一次状态演变后,将任务分配给物流机器人进行任务分配的状态转移:
第1步:构建所有物流机器人的初始状态和所有物流机器人的终止状态的矩阵;在矩阵中包含所有机器人自初始状态到终止状态的所有状态;
第2步:将所有物流机器人的状态由当前状态演变为下一状态,设定物流机器人访问任务的次数阈值;当物流机器人的当前状态访问次数小于访问任务的次数阈值时,使用启发式规则为物流机器人选择动作,将任务分配给相应的物流机器人;当当前状态访问次数大于访问任务的次数阈值时,根据优化的蒙特卡洛搜索树算法对动作序列At进行评估Q(st,at),选出动作at,将任务分配给动作at所对应的物流机器人,状态更新完毕,更新至状态st+1;其中,当前状态st节点是指物流机器人当前的工作状态,动作是指将任务选择物流机器人;
第3步:如果物流机器人演变后的状态不等于终止状态,重复执行第2步直至终止状态;
为拣选台设置的状态转移方程,在对为拣选台设置的状态转移方程进行演变时,第2步:根据优化的蒙特卡洛搜索树算法对动作序列At进行评估Q(st,at),选出动作at,将订单分配给动作at所对应的拣选台,状态更新完毕,更新至状态st+1;以及,第3步:如果拣选台演变后的状态不等于终止状态:st+1≠sterminal,重复执行第2步直至终止状态sterminal,具体包括:
将订单动态分配给拣选台的过程看作优化的蒙特卡洛搜索树算法的落子;其中,拣选台的初始状态s1作为蒙特卡洛搜索树的根节点,拣选台的终止状态sterminal作为优化的蒙特卡洛搜索树的目标节点,除根节点和目标节点之外的节点为叶子节点,采用优化的蒙特卡洛树算法进行搜索确定订单分配给拣选台的过程包括选择阶段、扩展阶段、模拟阶段和回溯阶段,其中:
选择阶段:节点选择时在优化的蒙特卡洛搜索树算法中增加对该节点的收益变化幅度约束;
扩展阶段:如果当前节点为优化的蒙特卡洛搜索树的叶子节点,则对蒙特卡洛搜索树进行分支扩展,扩展的原则是在该叶子节点被选择后该叶子节点模拟的动作唯一、且自动跳转到下一状态被当做扩展节点s1所选择的子节点s21时,其子节点为s3,可扩展节点s21,s3,使得订单分配动作确定时,假如其货架分配动作唯一,则直接扩展节点至下个状态,当下个状态存在多个订单分配动作a31,a32时扩展停止;
模拟阶段:在扩展停止后,通过贪心启发规则选择叶子节点中的某个叶子节点作为当前节点之后的节点;其中,将订单分配给拣选台所采用的启发规则包括:订单相似度、剩余任务量最少、剩余任务代价最小;
回溯阶段:每次模拟完成后,重新更新父节点信息,同时更新各个节点的收益历次平方和信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物资学院,未经北京物资学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110319717.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纺织线导收料装置
- 下一篇:工作流核验方法、装置、计算机设备及存储介质