[发明专利]一种面向开放场景的多机器人自主协同搜救方法有效
申请号: | 201910883109.7 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110587606B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 刘惠;丁博;王怀民;贾宏达;史佩昌;张捷;骆杰;怀智博;巩旭东;耿铭阳 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 陈晖 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 开放 场景 机器人 自主 协同 搜救 方法 | ||
本发明公开了一种面向开放场景的多机器人自主协同搜救方法,目的是快速构建多机器人在新任务场景下的自主协同策略,实现在开放场景中的多机器人自主协同搜救。技术方案是在多机器人系统在仿真搜救环境中应对各种可能出现的状况,形成基本多机器人协同搜救策略,使得多机器人系统面对无法预知的实际搜救场景时,能够仅使用少量时间进行策略优化,便可在开放场景下有效完成多机器人自主协同完成搜救任务。采用本发明能够基于仿真搜救环境中形成的预训练策略,快速形成对真实搜救场景的协同搜救策略,有效应对面对新场景制定策略的时间消耗问题。且本发明构建的搜救策略具有泛化性,能够适用于不同的搜救场景。
技术领域
本发明涉及在地震灾区等无法提前预知的开放场景中,如何让分布式多机器人自主协同完成目标搜救任务。尤其涉及多机器人在面对从未见过的、无法提前预知的灾后搜救任务场景时,实现自主形成协同策略以完成路径规划和目标追踪等任务的方法。
背景技术
目前常见的多机器人协同任务包括协同搜索、协同搬运、协同侦察等,相比于单机器人,多机器人能够处理合作型任务,具有更加灵活、高效、可靠的优点;并且能够实现群体智能涌现,达到“1+12”的效果。目前,多机器人自主协同已经被广泛用于灾后搜救等实际应用场景,极大地提升了搜救效率,同时降低了人力成本。但是目前的多机器人自主协同完成任务的策略(不论是人为设计协同策略还是基于机器学习方法),通常需要提前设计或训练,并且得到的策略只能针对单一任务进行测试并投入使用。
但是现实环境并非是静态封闭的,多机器人执行任务时常常面对的是开放场景,需要应对任务过程中某机器人因故退出、障碍物突然出现等突发情况,因此开放场景会给多机器人完成任务带来更多挑战。本发明中所考虑的一类典型的开放场景是,多机器人在之前从未见过并无法提前预知未来所要执行任务的具体场景。例如,地震之后的灾区地形会如何变化、各种障碍的出现数量和所在位置、届时能投入多少机器人参与救援等等,都只能等到地震发生之后才能获知。目前通常的做法是现场制定救援策略,但弊端在于:现场制定救援策略不可避免地要先消耗大量时间进行环境探索和商讨方案,导致不能快速投入救援,浪费灾后搜救的“黄金时间”。针对这一弊端,本发明实现了多机器人在从未见过的灾后搜救等任务场景中能够经过短暂“实习”快速投入救援中。
目前在机器人领域,基于深度学习的图像识别和深度强化学习的行为控制来实现的多机器人自主协同技术也已日渐成熟并开始在实际中实现应用。此类基于“数据驱动”的方法,能够让机器人实现对任务的自主学习,不依赖于人为设计任务策略。强化学习方法能够有效考虑机器人实际空间中的高维、连续状态空间、连续行为空间等实际特点,避免类似于在有监督学习中需要设置标签等难题,让机器人在不断探索和试错过程中,持续收集对任务在某个状态执行某个行为能获得怎样的收益而形成的经验,逐渐自主形成对环境的认知和掌握协同完成任务的策略;同时,深度学习方法的引入能够避免维持的状态空间指数爆炸的问题。因而通过融合深度学习方法和强化学习方法,深度强化学习方法在机器人自主协同应用中有着较好的表现。
然而相比于人为特征设计的方法,传统深度学习却具有数据依赖量大、训练时间长等长期存在的问题,除此之外,深度学习和融合深度学习的深度强化学习方法的另一个固有局限是训练的模型具有较高的任务相关性,也就是说,当任务场景发生变化的时候,之前训练的模型可能会出现不适合甚至失效的问题。这就导致了之前提到的多机器人掌握的某种策略只能用于单个任务的问题,比如多机器人在地震灾区有落石的障碍干扰的场景下学习到协同完成任务策略,但是当实际投入到地震场景时,却突然发现环境中有未预料到的陷阱等障碍,已有的多机器人行为策略便无法适应当前的环境。
除了外部环境中各类障碍的动态变化以外,机器人数目和角色也可能会发生变化。此外,在探索如何完成任务的过程中,其他机器人的行为也会对某机器人的观测和奖励获得产生影响,这种影响是相互作用持续存在的。以上问题意味着,多机器人系统的复杂度远远超过单机器人系统复杂度的和,并且真实环境中的复杂度会更高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910883109.7/2.html,转载请声明来源钻瓜专利网。