[发明专利]一种基于多精度交互的人群轨迹预测方法有效
申请号: | 202110855170.8 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113362367B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 刘绍华;孙靖凯 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T7/207 | 分类号: | G06T7/207;G06T7/246;G06N3/04 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 周长琪 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 精度 交互 人群 轨迹 预测 方法 | ||
本发明提出了一种基于多精度交互的人群轨迹预测方法,属于计算机视觉技术领域。本发明方法包括:使用LSTM网络来编码行人的历史状态;对行人的运动交互采用全局交互建模和局部交互建模方式,全局交互建模时先划分场景,对每个划分的子区域进行区域建模,再整合获取全局交互信息,最后将局部交互信息和全局交互信息拼接得到完整交互信息;在解码端利用一个LSTM网络进行解码,预测行人轨迹。通过全局交互信息对行人的轨迹做出微调,通过局部交互信息可以捕捉行人的细节运动信息,行人可以对近期运动做出及时的避让,更接近真实轨迹。采用本发明方法能更加准确预测行人轨迹,并在保证交互信息各异性的同时降低了计算复杂度。
技术领域
本发明属于计算机视觉技术领域,涉及人群轨迹预测和人群交互建模技术,具体涉及一种基于多精度交互的人群轨迹预测方法。
背景技术
轨迹预测算法根据行人的历史位置信息实现目标未来的轨迹信息预测,是目前计算机视觉领域的研究热点之一。伴随着5G网络商用和城市现代化的发展,国家高度重视智慧交通、公共安全等重点方向的建设,而轨迹预测算法作为必要的基础性研究技术,在自动驾驶、机器人导航、行人意图分析等现实场景中起到关键作用。例如在机器人导航系统中,机器人应该充分考虑场景内其他行人的轨迹信息,规划安全合理的路径避免碰撞。然而,行人不是只受牛顿定律影响运动的实体,相反人们会根据自己的主观意愿动态地改变运动状态,因此行人的轨迹一般不是线性的。其次在现实生活中运动场景错综复杂,人们会与场景内的其他行人发生多种复杂的交互,如跟随交互、避障交互等。这些复杂且多样的交互方式,给行人轨迹预测问题带来了许多挑战。
现有轨迹预测方法的流程一般可以分为以下三个阶段:
1)根据行人的历史位置坐标对行人运动状态信息编码;
2)对第一阶段编码的行人运动状态进行交互建模;
3)根据第一、第二阶段的建模数据进行解码,预测未来轨迹。
近几年有许多基于深度学习的方法被提出用于改进上述流程中第二阶段的行人交互建模。目前提出用于轨迹预测的模型有STGAT模型和StarNet模型等。
参考文件1(Huang Y,Bi H,Li Z,et al.Stgat:Modeling spatial-temporalinteractions for human trajectory prediction[C]//Proceedings of the IEEEInternational Conference on Computer Vision.2019:6272-6281.)公开一种新颖的时空图注意网络,称为STGAT,其中行人之间的空间和时间相互作用分别被编码。由于GAT(图形注意力网络)可以通过为不同节点分配不同的重要性来聚合来自邻居的信息,因此STGAT使用GAT建模行人间的运动信息共享和运动交互机制。该方案建模场景中涉及的所有行人之间的交互,每个时刻的空间相互作用由GAT捕获,通过深度学习,GAT结构可以自动为目标行人计算周围不同行人对其的运动影响。考虑到行人运动轨迹的时间连续性,STGAT使用额外的LSTM(长短期记忆网络)结构来捕获行人间交互的时间连续性。最后,利用序列生成序列(seq2seq)的架构来生成未来一段时间行人的运动轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110855170.8/2.html,转载请声明来源钻瓜专利网。