[发明专利]一种基于模版匹配的视点无关的人体动作识别方法无效
申请号: | 200810059129.4 | 申请日: | 2008-01-14 |
公开(公告)号: | CN101216896A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 庄越挺;肖俊;张剑;吴飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66;G06K9/00;G06T17/00;H04N7/18 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模版 匹配 视点 无关 人体 动作 识别 方法 | ||
技术领域
本发明涉及视频监控,尤其涉及一种基于模板匹配的视点无关的人体动作识别方法。
背景技术
一些研究者将人体动作识别等同于人体三维重建,他们认为如果能够恢复与视频对应的三维人体姿态,自然就达到了识别的目的。将预先建立的三维人体模型与图像中的二维人体轮廓进行适配,从而实现人体姿态的重建。然而,从任意图像序列中恢复三维信息是个十分复杂的、非线性的过程,容易受到噪声干扰,很不鲁棒。因此更多人研究如何从二维视频中直接对人体动作进行识别。Ekinci等人提出一种视频监控中的实时人体运动跟踪和姿态估计方法,他们采用背景建模技术提取人体运动轮廓,基于人体轮廓的骨架结构估计人体姿态。然而此项工作仅考虑离散的人体姿态,并未对时序上的人体姿态序列进行表示和建模。隐马尔可夫模型(Hidden Markov Models)适合描述物体在时间域上的运动模式,因此被广泛应用在人体动作识别。这类工作的原理是从视频帧序列中提取时序特征,并采用这些特征为每类动作训练HMMs。识别时从视频中提取运动序列的特征,并输入每个HMMs,选择输出概率最大的HMMs作为分类结果。由于HMMs是基于概率的识别方法,它们需要大量训练数据以确保结果的可靠性,因此对每类动作均需要大量视频作为训练样本,这在很多情况下难以保证。光流(Optical flow)是表征人体运动的重要特征。Ahmad等人采用光流表示视频帧间的人体运动信息,并基于HMMs进行动作识别,这项工作发表在IEEE国际模式识别会议中(IEEE International Conference on PatternRecognition,2006,263~266)。然而光流的计算效率较低,因此这种方法并不适合象视频监控之类的实时应用。Davis和Bobick提出的二维运动模板(IEEETransactions on PAMI,2001,23(3):257~267)是一种描述时序运动序列的有力工具。他们提出的运动能量图(Motion Energy Image)和运动历史图(Motion HistoryImage)能有效捕捉视频序列中的人体运动信息。MEI和MHI将一段视频序列中的时序人体运动信息压缩在一幅图像中进行表达。这种表示方式有助于避免复杂的视觉跟踪问题,将时序数据的识别简化为一个图像分类问题,因此大大提高了人体动作识别的效率。然而Davis的方法是视点相关的,即识别的效果依赖于具体的视点。作者只是在特定视点下构造二维运动模板,因此当待识别的人体动作是在其它视点下得到的,这种方法就会失效。唯一的解决手段就是在很多视点下分别构造运动模板,这不仅麻烦而且很不科学,因为我们无法事先预知待识别的动作具有怎样的视点。Michel等人提出结合MHI和k近邻(kNearest Neighbor)算法对人脸动作单元(Facial Action Unit)的运动进行识别(IEEE International Workshop on Human-Robot Interaction 2004,2004,253~258)。这种方法的效率在很大程度上依赖于样本数据的数量,当样本数据量很大时,kNN分类算法是非常耗时的。Weinland等人将MHI拓展到三维空间形成运动历史体(Motion History Volume),这项工作发表在《计算机视觉与图像理解》上(Computer Vision and Image Understanding,2006,104:249~257),尽管MHV是种视点无关的动作表达方式,构造MHV却需要多个严格标定过的视频摄像机。所以,当仅有单目监控视频时,很难通过构造MHV进行动作识别。
发明内容
本发明的目的是提供一种基于模板匹配的视点无关的人体动作识别方法。
它包括模板构造和动作识别两个部分:
1.一种基于模板匹配的视点无关的人体动作识别方法,其特征在于方法分为模板构造和动作识别两个部分:
模板构造的步骤为:
1)首先捕获三维人体动作作为样例,采用3D max构造三维人体模型并将三维运动数据与模型绑定,渲染为多个视点下的二维人体轮廓序列;
2)基于多视点的人体轮廓序列计算此动作在多个视点下的运动历史图和相应的极坐标特征;
3)采用流形学习算法将所有样例动作多视点下的极坐标特征映射至四维子空间,得到每个极坐标特征在子空间中的四维坐标;
4)对每个样例动作的多视点极坐标特征,通过在四维子空间中计算虚拟球心和超球半径来构造动作超球;
5)将多种样例动作的动作超球集成起来得到动作模板;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810059129.4/2.html,转载请声明来源钻瓜专利网。