[发明专利]用于控制机器人的方法和设备在审
申请号: | 202110181323.5 | 申请日: | 2021-02-10 |
公开(公告)号: | CN113341945A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | C-N·施特雷勒;S·J·艾特萨米 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 任一方;周学斌 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 控制 机器人 方法 设备 | ||
1.一种用于控制机器人的方法,所述方法包括:
获取表示机器人环境的传感器数据;
根据传感器数据标识机器人环境中的一个或多个对象;
将所述一个或多个对象中的每一个和机器人与多智能体系统的相应智能体相关联;
为多智能体系统的每个智能体确定质量度量,所述质量度量包括针对一位置处的移动动作的奖励项和取决于其他智能体在一时间处占用与所述智能体相同位置的概率的耦合项;
确定机器人的移动策略,所述移动策略以比具有为机器人确定的质量度量的较低值的移动动作更高的概率选择具有质量度量的较高值的移动动作;以及
根据移动策略控制机器人。
2.根据权利要求1所述的方法,其中耦合项是其他智能体的占用度量的泛函,其中,对于每个智能体,位置和时间的占用度量标示智能体在所述时间处于所述位置中的可能性。
3.根据权利要求1或2所述的方法,其中确定质量度量包括在多次迭代中迭代地确定质量度量,其中每次迭代包括在多个时间步长之上从初始时间到结束时间的前向传递和在多个时间步长之上从结束时间到初始时间的后向传递。
4.根据权利要求3所述的方法,其中耦合项是其他智能体的占用度量的泛函,并且前向传递包括通过使用智能体在当前时间步长处的策略来传播智能体的当前时间步长的占用度量,为每个智能体更新下一时间步长的占用度量。
5.根据权利要求3或4所述的方法,其中耦合项是其他智能体的占用度量的泛函,并且后向传递包括通过在下一时间步长处使用其他智能体的占用度量,为每个智能体更新在当前时间步长处的智能体的质量度量和策略。
6.根据权利要求1至5中任一项所述的方法,其中确定移动策略,使得取决于为机器人确定的质量度量,根据玻尔兹曼分布来分布用于多智能体系统的系统状态的动作。
7.一种机器人控制器,被配置为执行权利要求1至6中任一项的方法。
8.一种包括指令的计算机程序,所述指令当由计算机执行时,使得计算机执行根据权利要求1至6中任一项的方法。
9.一种包括指令的计算机可读介质,所述指令当由计算机执行时,使得计算机执行根据权利要求1至6中任一项的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110181323.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于产生旋转光束的光纤
- 下一篇:驱动面板的集成电路和包括集成电路的显示装置