[发明专利]基于归一化类谷歌量度矩阵的人体运动识别方法在审
申请号: | 201310385267.2 | 申请日: | 2013-08-29 |
公开(公告)号: | CN103413154A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 刘宏;孙倩茹 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 归一化 类谷歌 量度 矩阵 人体 运动 识别 方法 | ||
技术领域
本发明涉及一种鲁棒的视频运动信息挖掘技术,特别是一种用来应对复杂视频拍摄环境的鲁棒的视频运动信息挖掘技术。具体涉及到一种挖掘局部运动特征子块间“共生”关系的中层运动描述方法,属于与运动执行者无关的视频人体运动识别技术领域。
背景技术
视频中的人体运动分析是计算机视觉研究领域的重要课题,同时也是近年来备受关注的前沿研究方向之一。它在智能监控、人机交互、虚拟现实、基于内容的视频检索与编码等领域具有重要的理论研究意义和应用前景。其主要内容就是通过对视频数据中包含的人体运动信息进行特征提取和模式识别来理解所包含的运动类别和意图,它涵盖图像处理、计算机视觉、模式识别与人工智能等多个学科。视频人体运动分析的基础是对视频中的人体运动信息进行合理有效的描述。目前较为前沿和主流的方法主要是基于局部运动特征的词袋方法,其优点在于其利用的时候大量局部特征的统计特性,高效并且在一定情况下的抗干扰能力强;缺点是大部分词袋方法忽略了视频中原有的局部特征间的位置相关信息,使得其对复杂运动的区分度和识别精度出现了较强的局限性。
其次,在低噪声环境下获取的视频中进行运动检测和识别已经可以达到较高的识别效率,但是针对实际环境中的视频,人体运动描述和识别仍然面临很多难题,如人体遮挡、视频模糊、拍摄视角变化等,所需要解决的问题就变得更加复杂。这就更加要求特征提取和建立的方法本身具有强大的运动信息表征能力。
发明内容
本发明的目的是通过分析、提取局部运动特征之间的“共生”关系,计算将归一化类谷歌量度矩阵(可参考Qianru Sun,Hong Liu.Action Disambiguation Analysis Using Normalized Google-Like Distance Correlogram.In Proc.of Asian Computer Vision Conference2012,Part III,LNCS7726,pages425-437,2013.)在时间轴上进行拓展,在原有的特征分布关系的基础上进行描述向量的扩充,从而增强描述子在复杂视频环境下的运动表征能力和类间区分度。最终使用得到的描述特征向量训练人体运动分类器,获得较为鲁棒的视频中的运动识别效果。在与传统的词袋方法得到的统计直方图结合的过程中,采用双通道非线性支持向量机分类器。
本发明的技术内容:基于归一化类谷歌量度矩阵的人体运动识别方法,其步骤包括:
1)提取人体运动视频中的兴趣点,基于3D时空坐标对每个兴趣点的周围局部区域进行局部描述,得到所述兴趣点子块的3D-SIFT局部运动特征值;
2)根据所述3D-SIFT局部运动特征值对所述子块进行特征聚类得到不同类特征;
3)根据所述不同类特征进行空间归一化类谷歌量度和时间归一化类谷歌量度计算,并配组得到归一化类谷歌量度关系矩阵;
4)将所述归一化类谷歌量度关系矩阵和词袋法局部特征统计直方图训练得到分类器,对人体运动进行识别。
更进一步,通过时空滤波器组得到视频中的兴趣点。
更进一步,所述3D时空坐标表示兴趣点的空间横纵坐标和时间点,3D-SIFT局部运动特征值按照如下方法获得:
1)在任意一个检测到的兴趣点p(x,y,t)周围取2*2*2的像素模块,对其梯度极坐标进行计算:
θ(x,y,t)=tan-1(Ly/Lx)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310385267.2/2.html,转载请声明来源钻瓜专利网。