[发明专利]用于智能体路径规划的方法和存储介质在审
申请号: | 202110985562.6 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113515130A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 杨洪勇;宁新顺;刘飞;范之琳;韩艺琳;刘莉;王丽丽;张顺宁 | 申请(专利权)人: | 鲁东大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 烟台上禾知识产权代理事务所(普通合伙) 37234 | 代理人: | 齐素立 |
地址: | 264000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 智能 路径 规划 方法 存储 介质 | ||
本发明公开了一种用于智能体路径规划的方法,包括:步骤S1:建立智能体工作环境地图,并初始化智能体位置;步骤S2:根据目标位置和智能体位置,对智能体的方向状态和探测状态进行离散化,并初始化Q值表;根据目标位置和智能体位置,确定若干记忆节点,智能体以记忆节点为目标导向,并在移动过程中根据探测信息添加其它记忆节点,根据若干记忆节点和其它记忆节点建立记忆池;智能体根据移动过程中获得的回报更新Q值表,直到智能体到达目标位置或者智能体尝试次数超过第一预设阈值;步骤S3:更新记忆池中的记忆节点,得到更新后记忆池;步骤S4:智能体根据更新后记忆池规划路径,到达目标位置。
技术领域
本发明涉及多智能体路径规划技术领域,尤其涉及一种用于智能体路径规划的方法和存储介质。
背景技术
路径规划问题一直是机器人研究领域的热点,随着强化学习在各个领域的应用,强化学习与机器人路径规划问题也越来越紧密地联系起来。
强化学习解决的是序贯决策问题,在与环境交互的过程中会根据回报评估动作的好坏,提高使回报增加的动作概率,减小使回报减少的概率。强化学习是通过对环境不断地探索,在探索的过程中学习如何使下一步动作回报最大,不断地反复探索和迭代,使回报最大的动作序贯策略即为最优路径。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:传统强化学习和各种改进方法大多针对静态环境,对于动态的环境和复杂凹形障碍物无法取得理想结果,在动态环境中,机器人周围环境经常发生变化,因此无法利用传统的栅格表格法存储状态,传统强化学习在一个环境收敛后无法直接应用于另一个环境,仍然需要多次迭代尝试,泛化能力较差。
发明内容
本公开实施例提供了一种用于智能体路径规划的方法和存储介质,以解决现有技术中,对于动态环境,传统强化学习在一个环境收敛后无法直接应用于另一个环境,仍然需要多次迭代尝试,泛化能力较差的技术问题。
第一方面,提供了一种用于智能体路径规划的方法,该方法包括:步骤S1:建立智能体工作环境地图,并初始化智能体位置;步骤S2:根据目标位置和所述智能体位置,对智能体的方向状态和探测状态进行离散化,并初始化Q值表;根据目标位置和智能体位置,确定若干记忆节点,所述智能体以所述记忆节点为目标导向,并在移动过程中根据探测信息添加其它记忆节点,根据所述若干记忆节点和所述其它记忆节点建立记忆池;所述智能体根据移动过程中获得的回报更新所述Q值表,直到所述智能体到达所述目标位置或者所述智能体尝试次数超过第一预设阈值;步骤S3:根据离散后的方向状态、离散后的探测状态、所述Q值表和所述智能体的移动距离,更新所述记忆池中的记忆节点,得到更新后记忆池;步骤S4:所述智能体根据所述更新后记忆池规划路径,到达所述目标位置。
结合第一方面,在第一方面的第一种可能的实现方式中,所述步骤S2进一步包括:步骤S21:根据所述目标位置和所述智能体位置,得到智能体与所述目标位置之间的夹角后,将所述目标位置和所述智能体位置的相对方向离散化,得到离散化的方向状态;步骤S22:所述智能体探测到障碍物时,获取所述障碍物的类型和所述智能体与所述障碍物的距离,得到离散化的探测状态。
结合第一方面或者第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,通过人工势场初始化Q值表,对于动态障碍物设定斥力势场。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,通过以下公式计算得到斥力势场,斥力势场函数G’,
其中,ξ为斥力折扣因子,ξ∈[0,1],dnow为所述智能体在当前状态距离所述目标位置的欧氏距离,d0为动态障碍物斥力的影响范围,超出所述影响范围所述智能体不受斥力影响。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述步骤S2进一步包括:步骤S23:通过以下公式初始化Q值表,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110985562.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烘干毛巾架自动焊接设备
- 下一篇:一种艾司奥美拉唑钠合成方法