[发明专利]基于拉普拉斯正则组稀疏的人体行为识别方法有效
申请号: | 201310517792.5 | 申请日: | 2013-10-27 |
公开(公告)号: | CN103605952B | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 张向荣;焦李成;贾航华;杨浩;杨淑媛;李阳阳;马文萍;马晶晶 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/66 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 拉普拉斯 正则 稀疏 人体 行为 识别 方法 | ||
技术领域
本发明属于图像处理技术领域,更进一步涉及机器学习和计算机视觉技术领域中的一种基于拉普拉斯正则组稀疏的人体行为识别方法,本发明可以通过对视频中人体行为特征进行学习,恰当的表征出不同的人体行为,从而在此基础上实现计算机自主的对于不同行为进行分类识别。
背景技术
人体行为的识别和分析是现代计算机视觉领域中的研究热点,其研究主要致力于寻找使计算机智能地学习和识别人类行为乃至理解人类复杂行为的技术方法。人体行为识别在智能监控,人机交互以及智能摄像等领域均有良好应用前景。最为普遍的人体行为识别方法通常是:首先从包含人体运动的视频中检测和提取初级特征,通过对初级特征的学习得到人体运动的高级特征,并在此基础上对人体行为进行分类。其中的一个关键问题就是如何对不同的人体行为进行恰当的表示,因为表示的合理与否决定了后续分类的性能上限。另外,由于包含人体行为的视频具有数据量大、冗余信息多、含有噪声等不利因素,因此要求在对初级特征学习时用到的技术方法高效、简单且有一定抗噪声干扰能力。
电子科技大学申请的专利“一种基于相对梯度的ISA模型的行为识别方法”(申请号:201210578578.6,公开号:CN103065158A,公布日:2013.04.24)公开了一种基于相对梯度的ISA模型的行为识别方法,该方法的具体步骤为:第1步:样本数据的预处理;第2步:特征提取;第3步:特征聚类;第4步:分类/识别。该方法虽然能够对人体行为进行准确的分类与识别,但是,仍然存在的不足之处是:该方法是基于所有视频块,计算复杂度高,并且该方法中采用的主成分分析法,是一种线性分析方法,难以利用数据中的非线性信息。
Yan Zhu等人在论文“Sparse Coding on Local Spatial-Temporal Volumes for Human Action Recognition”(ACCV,2010)中利用基于Sparse Coding的方法进行行为识别。该方法的具体步骤为第1步:提取样本初级特征;第2步:训练字典;第3步:根据字典对初级特征进行编码得到稀疏编码向量,对稀疏编码向量做max-pooling得到每个视频的高级特征;第4步:对高级特征用支持矢量机方法进行分类。这种方法虽然对初级特征编码相对准确,但是,仍然存在的不足之处是,计算复杂度较高。
Samy Bengio等人在论文“Group Sparse Coding”(NIPS,2009)中提出Group Sparse Coding方法,该方法的具体步骤为第1步:提取样本的初级特征;第2步:构造字典;第3步:根据字典对初级特征进行编码得到组稀疏编码向量;第4步:根据这种组稀疏编码向量进行分类。这种方法虽然利用了字典原子的结构特性,使得对初级特征编码相对准确,且计算复杂度较低,但是,仍然存在的不足之处是:对于人体行为视频序列内部的结构信息未能加以利用。
发明内容
本发明针对上述现有技术的不足,提出一种新的无监督特征学习方法,在对人体运动中的初级特征进行编码时加入结构信息,使得人体行为的编码更具判别性,从而进一步提高对人体行为的智能识别能力。
实现本发明的具体思路是:从行为视频中检测并提取出初级特征,在该初级特征的基础上构造初级特征的相似度图和初始字典,由此得到图的拉普拉斯矩阵,利用具有拉普拉斯正则的组稀疏编码对视频中的初级特征进行编码,得到编码系数矩阵,对编码系数矩阵的每一行求l2范数,得到人体行为视频的高级特征,对人体行为视频高级特征利用分类器进行分类,从而达到识别人体行为的目的。
为了实现上述目的,本发明方法包括如下步骤:
(1)输入人体行为视频序列;
(2)提取初级特征:
2a)采用空时角点检测方法,提取人体行为视频序列兴趣点;
2b)根据兴趣点,提取人体行为视频序列的初级特征;
(3)构建初始字典和相似度矩阵:
3a)根据人体行为视频序列的初级特征,构建初始字典;
3b)根据人体行为视频序列的初级特征,构建相似度矩阵;
(4)编码初级特征:
4a)对人体行为视频序列中,每个视频的初级特征进行拉普拉斯正则组稀疏编码的目标函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310517792.5/2.html,转载请声明来源钻瓜专利网。