[发明专利]动作的生成方法、装置、电子设备及存储介质在审
申请号: | 202310147770.8 | 申请日: | 2023-02-15 |
公开(公告)号: | CN116360472A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 周明鑫;刘迪源;潘嘉;刘聪 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G05D1/08 | 分类号: | G05D1/08 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 尚文文 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作 生成 方法 装置 电子设备 存储 介质 | ||
本申请提供了动作的生成方法、装置、电子设备及存储介质,具体实现方案为:获取目标机器人的运动参数和环境图像数据;利用预设的动作生成模型对所述运动参数和所述环境图像数据进行处理,得到目标动作;其中,所述预设的动作生成模型,是根据仿真运动参数和仿真环境图像数据进行动作生成模仿学习与动作生成强化学习联合训练得到的。根据本申请的技术方案,能够使得机器人可以成功穿越不同的地形。
技术领域
本申请涉及深度学习技术领域,尤其涉及一种动作的生成方法、装置、电子设备及存储介质。
背景技术
随着技术的不断发展,四足机器人在工业巡检、灾难救援等领域比轮式机器人具有更高的优势和潜力。但是,现有的四足机器人的运动控制方案仅仅只依赖于机器人自身的感知信息,其不具有普适性,无法适用于地形复杂的场景(如,野外、救灾场地等)。例如,机器人感知外部环境的传感器(如激光雷达等)通常会由于物体的材质、光照等会获取到错误的信息,导致机器人无法穿越障碍物。
发明内容
为了解决上述问题,本申请提出一种动作的生成方法、装置、电子设备及存储介质,能够使得机器人可以成功穿越不同的地形。
根据本申请实施例的第一方面,提供了一种动作的生成方法,包括:
获取目标机器人的运动参数和环境图像数据;
利用预设的动作生成模型对所述运动参数和所述环境图像数据进行处理,得到目标动作;其中,所述预设的动作生成模型,是根据仿真运动参数和仿真环境图像数据进行动作生成模仿学习与动作生成强化学习联合训练得到的。
根据本申请实施例的第二方面,提供了一种动作的生成装置,包括:
获取模块,用于获取目标机器人的运动参数和环境图像数据;
生成模块,用于利用预设的动作生成模型对所述运动参数和所述环境图像数据进行处理,得到目标动作;其中,所述预设的动作生成模型,是根据仿真运动参数和仿真环境图像数据进行动作生成模仿学习与动作生成强化学习联合训练得到的。
本申请第三方面提供了一种电子设备,包括:
存储器和处理器;
所述存储器与所述处理器连接,用于存储程序;
所述处理器,通过运行所述存储器中的程序,实现上述的动作的生成方法。
本申请第四方面提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现上述的动作的生成方法。
上述申请中的一个实施例具有如下优点或有益效果:
由于预设的动作生成模型是采用仿真数据(即仿真运动参数和仿真环境图像数据)进行训练的,而且通过模仿学习与强化学习联合训练能够进一步保证了生成动作的真实性。所以训练好的动作生成模型不只依赖于机器人的本体感知信息,能够根据运动参数和环境图像数据生成更真实的目标动作,如此,将运动参数与视觉信息进行融合使得机器人能够适用于各种地形的场景。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种动作的生成方法的流程示意图;
图2为本申请实施例提供的一种动作的生成方法中训练动作生成模型的流程示意图;
图3为本申请实施例提供的训练动作生成模型的教师模型的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310147770.8/2.html,转载请声明来源钻瓜专利网。