[发明专利]基于核分块注意力机制的马拉松场景人群运动追踪方法在审
申请号: | 202211294812.2 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115565136A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 黎俊良;张世雄;魏文应;陶键源;张伟民;肖铁军 | 申请(专利权)人: | 广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/70;G06V20/40;G06N3/04;G06V10/42;G06V10/44;G06V10/80;G06V10/82 |
代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 万学堂;王跃交 |
地址: | 518116 广东省深圳市龙岗区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分块 注意力 机制 马拉松 场景 人群 运动 追踪 方法 | ||
本发明提供了一种基于核分块注意力机制的马拉松场景人群运动追踪方法,包括以下步骤:S1.基本模型搭建,基本模型包含特征模板、高斯混合模型和运动趋势预测算法三个部分;S2.建立核分块注意力机制模块;S3.使用核分块注意力机制模块改进基本模型。本发明方法通过核分块注意力机制能从视频帧的特征图中提取更有用的语义特征,核分块注意力机制模块通过对作为卷积核的对比向量进行分块处理,从而能在注意力运算中提取更多有效的局部特征信息;此外,把局部特征与全局特征融合起来,从而提高提取特征的质量,生成更高质量的特征图;然后,高斯混合模块则可以通过这些特征图更准确地识别出马拉松每个参赛者的位置,从而提高运动轨迹预测的精准度。
技术领域
本发明涉及计算机视觉领域,特别地涉及一种基于核分块注意力机制的马拉松场景人群运动追踪方法。
背景技术
在马拉松比赛场景下,为了防止大量参赛者碰撞等事故的发生,对处于密集人群中的参数者进行运动位置追踪与运动趋势预测是很有必要。由于在密集人群场景中,每个目标个体在视频帧中所占面积非常小,为了能更好地提取每个目标个体的特征,需要使用有效的密集人群运动追踪算法去提取每个目标个体的特征并检测出其位置。更仔细地说,很多密集人群运动追踪算法的主要流程是从视频帧中提取出密集人群特征,从中识别出每个目标个体所在的位置;当每个视频帧的目标个体的位置都被检测后,则可以从连续的视频序列数据中预测每个目标个体的运动趋势。
为了解决相似的密集人群运动追踪问题,有很多能达到高精准度的算法与模型已被提出。为了能有效检测到目标位置,除了一部分可用于提取目标边界与轮廓等低级特征的方法,还有善于获取语义信息与时序信息等高级特征的方法被提出。但是,由于马拉松比赛场景下的人群密度大,仅仅依靠提取人群个体的传统特征不能把每个目标个体都准确地检测出来。另一方面,虽然具有强大特征学习能力的深度学习模型也被应用于密集人群运动追踪问题中,但其复杂的模型结构导致其需花费一定时间去完成特征提取操作。由于在实际应用中,运动追踪算法需要在数据处理中达到实时处理的效果,所以耗费运算时间的深度学习模型并不适用于需要实时处理的马拉松参赛者运动追踪实际应用中。
由于具有强大的特征提取能力,注意力机制(Attention Mechanism)被广泛用于特征提取操作。因此,本发明通过用注意力机制改进人群运动追踪算法,从而使其在马拉松场景中,即使是人群密度大,参赛者数量多的情况中,也能从中获取更多目标个体的特征,从而把人群中的目标个体位置检测出来。本发明提出核分块注意力机制模块去从包含马拉松参数者场景的视频数据中获取不同的语义信息,并把包含局部信息与全局信息的特征都结合起来,从而产生更精确的特征。为了实现这个算法,本发明采用一个适用于密集人群运动追踪的算法框架为基本模型。该基本模型中主要由特征模板、高斯混合模型和运动趋势预测算法这三部分构成,通过把本发明提出的核分块注意力机制加入到该模型中,可提取更高质量的语义特征,进而提高马拉松场景人群运动追踪的精度,便于预测其运动轨迹。
发明内容
本发明提供了一种基于核分块注意力机制的马拉松场景人群运动追踪方法,在马拉松场景中能提高运动趋势预测的准确度;包含核分块注意力机制模块的新模型的准确度高于不包含该核分块注意力机制模块的模型的准确度。
本发明的技术方案如下:
本发明的基于核分块注意力机制的马拉松场景人群运动追踪方法,包括以下步骤:S1.基本模型搭建,基本模型包含特征模板、高斯混合模型和运动趋势预测算法三个部分;S2.建立核分块注意力机制模块;S3.使用核分块注意力机制模块改进基本模型。
优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S1中,选取一个高效的密集人群运动追踪算法模型作为基本模型,基本模型包含用于提取特征的特征模板、高斯混合模型和运动趋势预测算法三个部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院,未经广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211294812.2/2.html,转载请声明来源钻瓜专利网。