[发明专利]基于拉普拉斯正则组稀疏的人体行为识别方法有效

申请号：	201310517792.5	申请日：	2013-10-27
公开（公告）号：	CN103605952B	公开（公告）日：	2016-11-23
发明（设计）人：	张向荣;焦李成;贾航华;杨浩;杨淑媛;李阳阳;马文萍;马晶晶	申请（专利权）人：	西安电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/66
代理公司：	陕西电子工业专利中心 61205	代理人：	田文英;王品华
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于拉普拉斯正则组稀疏的人体行为识别方法，主要用于解决现有技术中对特征的编码方法中没有考虑视频内部结构信息且计算效率较低的问题。其实现步骤为：（1）输入人体行为视频序列；（2）提取初级特征；（3）构建初始字典和相似度矩阵；（4）编码初级特征；（5）分类；（6）输出检测结果。本发明在组稀疏编码的基础上，加入了人体行为视频序列内部的结构信息，增强了人体行为视频序列编码的判别性，提高了分类精度，使得对人体行为的识别更加准确。
搜索关键词：	基于拉普拉斯正则稀疏人体行为识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于拉普拉斯正则组稀疏的人体行为识别方法，包括以下步骤：(1)输入人体行为视频序列；(2)提取初级特征：2a)采用空时角点检测方法，提取人体行为视频序列兴趣点；所述空时角点检测方法的具体步骤为：第1步，计算人体行为视频序列中图像像素点在水平方向，垂直方向和时间方向的梯度，得到矩阵Q：其中，Q表示矩阵，I_x表示人体行为视频序列中图像像素点在水平方向的梯度，I_y表示人体行为视频序列中图像像素点在垂直方向的梯度，I_t表示人体行为视频序列中图像像素点在时间方向的梯度；第2步，对矩阵Q进行高斯滤波，得到滤波后的矩阵U：其中，U表示滤波后的矩阵，g(x,y,t；σ²,τ²)表示用来对矩阵Q进行滤波的空时高斯函数，x,y,t分别表示图像像素点的位置坐标，表示卷积，σ表示空域尺度，τ表示时域尺度；第3步，计算人体行为视频序列中图像像素点的兴趣值R：R＝det(U)‑ktr³(U)其中，R表示人体行为视频序列中图像像素点的兴趣值，det(U)表示滤波后矩阵U的行列式，k表示平衡因子，k的取值是0.04，tr(U)表示滤波后矩阵U的迹；第4步，设定一个阈值T＝0.03：第5步，将大于阈值T的兴趣值的像素点，作为人体行为视频序列中的兴趣点；2b)根据兴趣点，提取人体行为视频序列的初级特征；(3)构建初始字典和相似度矩阵：3a)根据人体行为视频序列的初级特征，构建初始字典；3b)根据人体行为视频序列的初级特征，构建相似度矩阵；(4)编码初级特征：4a)对人体行为视频序列中，每个视频的初级特征进行拉普拉斯正则的组稀疏编码的目标函数如下：其中，B表示编码系数矩阵，y_i表示人体行为视频序列中每个视频的初级特征中第i个特征向量，M表示人体行为视频序列中每个视频的初级特征中特征向量的个数，表示编码系数矩阵B的第j行第i列元素，d_j表示初始字典D₀的第j列，||·||₂²表示2‑范数的平方和，λ和μ分别表示平衡编码稀疏矩阵稀疏性和拉普拉斯约束的正则参数，取值范围是0～1，||·||_p表示p范数，tr(BLB^T)表示矩阵BLB^T的迹，L表示人体行为视频序列中每个视频的拉普拉斯矩阵；4b)使用坐标下降的方法，对目标函数进行求解，得到人体行为视频序列中每个视频的初级特征的编码系数矩阵：其中，B表示N行M列的编码系数矩阵，N表示初始字典原子的个数，M表示人体行为视频序列中每个视频的初级特征中特征向量的个数；β_j^T表示编码系数矩阵B的第j行,j表示编码系数矩阵的行坐标，b_i表示编码系数矩阵B的第i列，i表示编码系数矩阵B的列坐标；4c)对编码系数矩阵B的每一行求2‑范数，得到人体行为视频序列中每个视频的高级特征Z：Z＝[z₁,...z_k,...,z_N]^T其中，Z表示人体行为视频序列中每个视频的高级特征，z_k表示人体行为视频序列中每个视频的高级特征Z的第k个元素，z_k＝||B_k||₂，||B_k||₂表示对编码系数矩阵B的第k行求2‑范数，k＝1,2,...,N，N表示人体行为视频序列中每个视频的高级特征的维数；(5)分类：5a)将每一个动作者的人体行为视频的所有高级特征分别作为测试集，其他动作者的人体行为视频的高级特征作为训练集，利用训练集中的所有样本组成N行m列的字典H＝[H₁,...,H_j,...,H_c]，H_j表示第j类的字典原子，j表示字典的类别标号，j＝1,2,...,c，c表示总类别数，N表示人体行为视频序列中每个视频的高级特征的维数，m表示字典H所有原子个数；5b)按照下式，计算每个测试样本的稀疏编码系数向量：其中，表示测试集中的测试样本，H是训练集中的所有样本组成的字典，θ表示稀疏编码系数向量，||·||₂²表示2‑范数的平方和，||·||₁表示向量的l₁范数,η表示平衡重建误差和编码稀疏性的正则参数，取值范围是0～1；5c)按照下式，计算测试样本在每类字典上的残差：其中：表示测试样本在每类字典上的残差，表示测试集中的测试样本， θ_j表示测试样本在第j类字典H_j上的编码系数向量；5d)将最小残差所对应的字典类标赋给测试样本得到测试样本的类标；(6)输出检测结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310517792.5/，转载请声明来源钻瓜专利网。

上一篇：一种清洗瓶顶盖气动工装
下一篇：一种基于故障树和层次分析法的电力变压器状态评估方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于拉普拉斯正则组稀疏的人体行为识别方法有效

专利文献下载