[发明专利]多智能主体协同搬运物件的方法、系统和存储介质在审
申请号: | 202010797223.0 | 申请日: | 2020-08-10 |
公开(公告)号: | CN112034843A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 于欣佳;程涛 | 申请(专利权)人: | 深圳技术大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 王利彬 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 主体 协同 搬运 物件 方法 系统 存储 介质 | ||
1.一种多智能主体协同搬运物件的方法,其特征在于,所述方法包括:
从执行搬运物件这一任务的多智能主体中确定一目标智能主体;
根据成本函数,从决策集中为所述目标智能主体调用相应的至少一策略以控制所述目标智能主体执行期望行为,所述成本函数与所述目标智能主体的激励成本函数以及所述多智能主体中除所述目标智能主体之外的其他智能主体相对所述目标智能主体的交互成本函数相关;
按照所述目标智能主体周围的邻居分布各向异同性以及多智能主体中各个智能主体之间释放的信息素,构建多智能主体协同作业的拓扑结构;
在所述多智能主体协同作业的拓扑结构下,更新所述目标智能主体的协同作业伙伴;
更新所述目标智能主体的移动速度与位置,返回所述构建多智能主体协同作业的拓扑结构的步骤,直至所述多智能主体完成搬运物件这一任务。
2.根据权利要求1所述的多智能主体协同搬运物件方法,其特征在于,所述根据成本函数,为所述目标智能主体从决策集中调用相应的至少一策略以控制所述目标智能主体执行期望行为,包括:
确定所述多智能主体中目标智能主体的交互成本函数;
根据所述交互成本函数和所述激励成本函数确定所述目标智能主体的成本函数;
根据所述目标智能主体的成本函数,从所述决策集中获得一策略,根据所述策略控制所述目标智能主体执行期望行为。
3.根据权利要求1所述的多智能主体协同搬运物件的方法,其特征在于,所述在所述多智能主体协同作业的拓扑结构下,更新所述目标智能主体的协同作业伙伴,包括:
按照选中概率pj与距离dij成反比原则,在距离所述目标智能主体的视野半径r范围内从最邻近的m个邻居中选择智能主体作为目标智能主体的预协同作业伙伴Aj,所述所述dij为所述目标智能主体与所述预协同作业伙伴Aj之间的距离,所述m为6或7;
将所述预协同作业伙伴Aj的合适度与预设合适度函数阈值fthre相比,若所述预协同作业伙伴Aj的合适度大于所述fthre,则不将所述预协同作业伙伴Aj作为所述目标智能主体的协同作业伙伴,否则将所述预协同作业伙伴Aj作为所述目标智能主体的协同作业伙伴。
4.根据权利要求1所述的多智能主体协同搬运物件的方法,其特征在于,所述更新所述目标智能主体的移动速度与位置,包括:
通过引入的两极分化因子对所述多智能主体群体进行控制,以更新所述目标智能主体的移动速度与位置,所述所述vi是所述多智能主体中第i个智能主体的速度,所述||vi||为计算vi在其度量空间中的范数。
5.根据权利要求1所述的多智能主体协同搬运物件的方法,其特征在于,所述交互成本函数与期望差值相关,所述期望差值为转移之后的多智能主体中除所述目标智能主体之外的其他智能主体的动作-成本函数与忽略所述智能主体的状态和动作的条件下经反真实计算得到的动作-成本函数的期望差值。
6.根据权利要求5所述的多智能主体协同搬运物件的方法,其特征在于,所述多智能主体中除所述目标智能主体之外的其他智能主体的动作-成本函数与除所述目标智能主体之外的其他智能主体的奖励以及所述其他智能主体在转移之后的期望累计收益之和相关。
7.根据权利要求5所述的多智能主体协同搬运物件的方法,其特征在于,所述经反真实计算得到的动作-成本函数与除所述目标智能主体之外的其他智能主体的反真实奖励以及所述其他智能主体在转移之后的反真实的期望累计收益之和相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳技术大学,未经深圳技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010797223.0/1.html,转载请声明来源钻瓜专利网。