[发明专利]一种基于自然语言和语义地图实现机器人自主导航的方法有效
申请号: | 201910981685.5 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110825829B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 董敏;聂宏蓄;毕盛;杨垲泓 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G01C21/00;G06N3/0442;G06N3/0455;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 语义 地图 实现 机器人 自主 导航 方法 | ||
1.一种基于自然语言和语义地图实现机器人自主导航的方法,其特征在于,包括以下步骤:
1)获取机器人所处环境的语义地图,包括出发点、目的地及其它位置之间的拓扑关系;其中,所述机器人所处环境的语义地图是指用于描述机器人所处环境的拓扑地图,包括表示环境中各个区域的顶点和表示顶点间相互通达关系的边;
2)将获取到的语义地图中各个位置用顶点表示,用顶点间的边表示顶点的通达关系,将每一对顶点之间的通达关系描述成三元组;
3)通过两组双层GRU编码器分别提取已描述成三元组集合的语义地图的特征和自然语言指令的特征,包括以下步骤:
3.1)每个包含N个三元组的语义地图M及每个包含L个词语的自然语言指令I分别描述为:
M={<p1,b1,q1,...,pN,bN,qN>}
I={l1,...,lL}
其中:地图中的第i个三元组表示为<pi,bi,qi>,下标i=1,2,3,...,N表示N个三元组的索引号;自然语言指令中的第i个词语表示为li,下标i=1,2,3,...,L表示自然语言指令中L个词语的索引号;
3.2)将三元组通过embedding层用向量表示,将自然语言指令通过embedding层用向量表示,三元组的向量表示和自然语言指令的向量表示分别描述为:
EM={g1,...,gN}
EL={i1,...,iL}
其中:语义地图中第i个三元组的embedding向量表示为gi,下标i=1,2,3,...,N表示N个三元组的embedding向量索引号;自然语言指令中第i个单词的embedding向量表示为ii,下标i=1,2,3,...,L表示自然语言指令中L个单词的embedding向量索引号;
3.3)将语义地图的embedding向量和自然语言指令的embedding向量分别通过双层GRU进行编码,获取特征向量,语义地图和自然语言指令的特征向量分别描述为:
FM={fg1,....,fgN}
FL={fi1,...,fiL}
其中:第i个三元组的特征向量表示为fgi,下标i=1,2,3,...,N表示N个三元组的特征向量索引号;自然语言指令中第i个词语的特征向量表示为fii,下标i=1,2,3,...,L表示自然语言指令中L个词语的特征向量索引号;
4)通过注意力机制将语义地图的特征和自然语言指令的特征融合,包括以下步骤:
4.1)对每一个三元组的特征向量,计算其关于自然语言指令中每个词语对应特征向量的注意力,其过程描述为:
ei=[fgiWfi1,...,fgiWfiL]
ai=softmax(ei)
其中,W表示不同维度的特征向量相乘时的权重,ei表示语义地图特征fgi关于自然语言指令的每一个特征向量的注意力向量,ai表示语义地图特征fgi关于自然语言指令的每一个特征向量的权重,fil表示自然语言指令中第l个词语的特征向量;
4.2)通过注意力权重将语义地图特征和自然语言指令特征融合,其过程描述为:
R={R1,...,RN}
其中,Ri表示N个融合特征向量第i个融合的特征向量,aij表示第i个三元组特征对第j个自然语言指令特征的注意力权重,fij表示第j个自然语言指令特征;
5)通过双层GRU解码器逐步生成导航指令;
6)将解码得到的导航指令转换成机器人能够执行的指令序列,机器人根据指令序列进行自主导航。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910981685.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示装置
- 下一篇:一种基于分水岭的极化SAR影像超像素分割方法