[发明专利]一种基于正则回归的秩-1张量投影的行为识别方法有效
申请号: | 201110221826.7 | 申请日: | 2011-08-04 |
公开(公告)号: | CN102289685A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 赖剑煌;吴娴;郑伟诗 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 杨晓松 |
地址: | 510006 广东省广州市广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 正则 回归 张量 投影 行为 识别 方法 | ||
技术领域
本发明涉及计算机视觉和图像处理领域,特别涉及一种基于正则回归的秩-1张量投影的行为识别方法。
背景技术
人的行为识别是计算机视觉领域的一个重要研究方向,它的目的是让计算机能够像人一样理解人的行为。目前这一技术在智能监控、虚拟现实、人机交互和运动分析等方面均有广泛的应用,但是当场景复杂时,人的行为识别的结果远远达不到人们的预期目标,仍不能达到技术实用化的需求。
人体行为存在于视频序列中,是包含空间和时间信息的三维数据。处理视频数据的传统方法通常是将视频中的每帧图像转化成单一向量,再按行/列的顺序接连成一个矩阵作为其表达形式。将视频帧图像转化为向量很容易造成维数灾难,同时也破环了帧图像内部的空间结构。目前主要有以下几种方法:
(1)Wang和Suter(L.Wang and D.Suter,Recognizing human activities fromsilhouettes:motion subspace and factorial discriminative graphical model,CVPR2007)利用基于图模型的子空间方法进行行为识别,但将视频帧图像转化为向量进行处理,很容易遭遇维数灾难和小样本问题。
(2)凌等(凌志刚,梁彦,潘泉,程咏梅,赵春晖,基于张量子空间学习的人行为识别方法,中国图象图形学报A,2009,14(3):394-400)利用张量子空间方法(张量主成份分析,有监督和无监督的张量局部保持投影)进行行为识别,提取的特征张量本质是矩阵形式,丢失了时序信息,在时间上需要归一化距离度量。
(3)Weinland和Boyer(D.Weiland and E.Boyer,Action recognition usingexemplar-based embedding,CVPR2008)通过提取若干(实验中取50个)静态关键姿势,将行为看成一系列关键姿势的表达进行识别。但它丢失了时间信息,同时对行为之间不同的执行速率较为敏感。
(4)Kellokumpu等(V.Kellokumpu,G.Zhao and M.Pietikainen,Humanactivity recognition using a dynamic texture based method,BMVC2008)利用三个正交平面上的局部二值模式提取行为的低维纹理特征进行识别,但原始行为数据中背景、行为者外貌、穿着等都会造成杂乱的纹理信息,而且三个正交平面上空时信息不足以刻画整个人体行为的有效特征。
上述方法主要存在两个缺陷:(1)张量子空间方法利用高阶奇异值分解(High Order-SVD)方法求解最优化问题,从而产生巨大的时间花费。(2)若把原始视频数据的紧凑表示称为“特征张量”,它的一般形式也是三维的,对于三维体的特征张量,何种度量方法为最优尚未得到验证。
以上的两大缺陷使得现有张量表示的行为识别方法无论从识别性能还是时间效率上,并没有达到行为识别的实用要求,限制了此方法的应用范围。因此,应用领域需要提供一种识别精度高、计算量较小且能满足实用要求的行为识别方法。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于正则回归的秩-1张量投影的行为识别方法,该方法在获得更高行为识别率的同时降低了计算的时间花费,具有很强的实用性。
本发明的目的通过以下的技术方案实现:一种基于正则回归的秩-1张量投影的行为识别方法,包括以下步骤:
(1)训练过程:对已知行为类别的训练数据进行预处理,得到完整的前景行为数据、原始行为数据和显著行为数据,然后对上述数据采用One Vs All的策略对每种行为分别训练一个两类分类器,进而求得一个包括三个投影向量的投影向量集,通过投影向量集外积得到秩-1张量投影,将已知类别的训练行为按种类划分为多个子集,构建子集嵌入;
(2)识别过程:将测试数据输入到步骤(1)所得到的各个两类分类器,然后将所有两类分类器的输出响应组成行向量,将此行向量与步骤(1)所得到的每一维的子集嵌入结果相乘,找到相乘结果最大的行向量,其所对应的两类分类器所代表的正样本类别即是测试行为所判定的类别。
所述步骤(1)中,所得到的前景行为数据、显著行为数据需进行空间归一化,使其大小相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110221826.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线射频卡的结构
- 下一篇:油墨小车