[发明专利]一种人体动作识别方法有效
申请号: | 201810373614.2 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108629301B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 范敏;韩琪;刘亚玲;陈欢;胡雅倩;范理波 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06K9/62;G06T7/246;G06T7/269;G06T7/277;G06V10/80;G06V10/774;G06V10/77;G06V10/764 |
代理公司: | 重庆缙云专利代理事务所(特殊普通合伙) 50237 | 代理人: | 王翔 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 动作 识别 方法 | ||
本发明公开一种基于运动边界稠密采样和运动梯度直方图的人体动作识别方法,主要包括以下步骤:1)输入视频流。2)计算输入视频的光流场并进行特征点采样,提取稠密特征点。3)计算特征点的轨迹。4)沿该特征点轨迹计算稠密描述符。5)对相邻两帧视频图像在时间上求导得到时序上的运动图像,再计算运动图像的空间梯度,得到运动梯度描述符HMG。6)对各个描述符分别进行特征编码。7)对各个描述符作正则化处理后,将稠密描述符与运动梯度描述符以串联形式相连接形成特征向量。8)对特征向量进行训练和学习得到人体动作识别模型。9)利用所述人体动作识别模型对人体动作进行识别。本发明在提高动作识别精度的同时缩减了计算开销。
技术领域
本发明涉及机器视觉领域,具体是一种基于运动边界稠密采样和运动梯度直方图的人体动作识别方法。
背景技术
人体动作识别是计算机视觉领域研究的重要分支之一,其在视频监控、视频检索、人机交互、虚拟现实、移动分析等领域有着极大的应用价值。但人体动作本身具有较大自由度,因相机运动、视角变化造成的类间差异,动作的识别与人体姿势、相关目标及场景的复杂关系等因素给人体动作识别带来极大的挑战性。
在动作识别中,通常采用的基于底层像素的特征表示对复杂背景有着较强的鲁棒性,但是单独采用全局或者局部特征来描述运动信息存在局限性,所以将多个特征相结合的识别方法受到研究者们的关注。并且,视频主要包含两类信息:视频帧中的静态信息和视频帧之间的运动信息。视频中的人体运动信息又具有时序性和空间性,充分发到动作信息在时间和空间位置上的关联关系是非常必要的。
为准确实现人体动作识别,运动信息的特征表示是非常关键的环节。由于视频中存在相机移动,并且稠密采样会产生过多的特征点需要被跟踪,其中只有部分可用于有效的特征计算,造成人体动作的特征表示不够准确,同时也带来了大量计算。
发明内容
本发明的目的是解决现有技术中存在的问题。
为实现本发明目的而采用的技术方案是这样的,一种基于运动边界稠密采样和运动梯度直方图的人体动作识别方法,其特征在于,主要包括以下步骤:
1)输入视频流。
2)计算输入视频的光流场并进行特征点采样,提取稠密特征点。
进一步,提取稠密特征点的主要步骤如下:
2.1)对输入视频进行光流计算,得到光流梯度幅值的运动边界。
2.2)在光流计算中,对运动边界设定阈值形成一个“掩膜”并进行稠密采样。
掩膜MB(i,j)如下所示:
式中,Tu和Tv分别为光流场在水平方向u和垂直方向v的分量。 Tω为二维光流图。为光流的分量u对v求导得到的值。为光流的分量v对v求导得到的值。为光流的分量v对u求导得到的值。为光流的分量u对u求导得到的值。max表示最大值。Ostu(*)表示取(*)的最大类间方差。
其中,二维光流图Tω如下所示:
Tω=(Tu,Tv)。 (2)
式中,Tu和Tv分别为光流场在水平方向u和垂直方向v的分量。ω为水平方向u和垂直方向v所在的平面。
其中,光流场ω如下所示:
ω=(u,v)。 (3)
式中,u为光流场水平方向。v为光流场垂直方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810373614.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跌倒检测方法
- 下一篇:一种基于卷积神经网络的用眼行为识别方法