[发明专利]基于非负矩阵分解的分部位人体运动识别方法有效
申请号: | 201410079746.6 | 申请日: | 2014-03-06 |
公开(公告)号: | CN103824062B | 公开(公告)日: | 2017-01-11 |
发明(设计)人: | 韩红;史媛媛;曹赛;洪汉梯;陈建;李楠;刘三军;甘露;郭玉言 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 陕西电子工业专利中心61205 | 代理人: | 王品华,朱红星 |
地址: | 710071*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于非负矩阵分解的分部位人体运动识别方法,主要解决现有技术中特征提取复杂、表征能力弱、计算量大的问题。其实现步骤是:(1)从训练视频集X中选取一个样本视频I,检测人体各部位的运动兴趣点及相对应部位的运动特征;(2)将人体各部位运动特征进行非负矩阵分解;(3)将经过分解后的人体各部位运动特征进行级联,级联的结果作为最终特征;(4)按上述步骤分别对训练视频集X和测试视频集T中的所有视频进行特征提取,获得训练样本特征集X'和测试样本特征集T',并进行学习训练,获得分类结果。本发明能准确识别人体运动,可用于视频监控、人体姿态估计和运动识别的视频处理。 | ||
搜索关键词: | 基于 矩阵 分解 部位 人体 运动 识别 方法 | ||
【主权项】:
一种基于非负矩阵分解的分部位人体运动识别方法,包括如下步骤:(1)将KTH数据库中的运动视频按照99:1的比例选取训练视频集X和测试视频集T;(2)根据Fischler和Elschlager提出的图结构模型将人体划分为5部分,分别为:头部,左上肢,右上肢,左下肢,右下肢;(3)从训练视频集X中选取一个样本视频L,根据上述划分分别提取人体各部位的运动兴趣点及相对应的运动特征;(4)将提取的人体各部位的运动特征通过下式进行非负矩阵分解;E=V‑WH其中,V为正实数空间中n×m维矩阵,用来表示人体各部位运动特征矩阵,H为正实数空间中s×m维矩阵,用来表示一个基础矩阵,W为正实数空间中n×s维矩阵,用来表示一个投影矩阵,即人体各部位运动特征矩阵V在基础矩阵H上的投影,E为实数空间中n×m维矩阵,用来表示一个误差矩阵,参数n,m,s均为正整数;(5)计算上述非负矩阵分解式中的投影矩阵W和基础矩阵H,设定误差矩阵E的阈值矩阵E',使得误差矩阵E小于或等于设定的阈值矩阵E':(5a)根据人体各部位运动特征矩阵V的维数大小n、m,利用公式s<<m*n/(m+n)选取正整数s,并随机生成大小为n×s维的投影矩阵W和大小为s×m维的基础矩阵H;(5b)设定阈值矩阵E'=1*10‑6;(5c)分别计算人体各部位的误差矩阵Eq:Eq=Vq‑WqHq;其中q=1,2,3,4,5,分别表示人体的头部,左上肢,右上肢,左下肢,右下肢这5个部位,Vq表示部位q的运动特征矩阵,Wq表示部位q的投影矩阵,Hq表示部位q的基础矩阵;(5d)当人体各部位误差矩阵Eq大于阈值矩阵E'时,分别对投影矩阵Wq中的元素Wik和基础矩阵Hq中的元素Hkj进行更新,得到投影矩阵Wq中更新后的元素Wik*和基础矩阵Hq中更新后的元素Hkj*:#Wik*=Wik(VqHqT)ik(WqHqHqT)ik,]]>Hkj*=Hkj(WqTVq)kj(WqTWqHq)kj,]]>其中:Wik表示投影矩阵Wq第i行第k列元素,0<i≤n,0<k≤s,Hkj表示基础矩阵Hq第k行第j列的元素,0<k≤s,0<j≤m,上标T表示矩阵的转置;(5e)通过对投影矩阵Wq和基础矩阵Hq全部元素的更新得到更新后的投影矩阵Wq*和基础矩阵Hq*,并用更新后的投影矩阵Wq*和基础矩阵Hq*替换原有的投影矩阵Wq和基础矩阵Hq:Wq=Wq*,Hq=Hq*,(5f)重复步骤(5c)~(5e),直至人体各部分误差矩阵Eq等于或小于阈值矩阵E'为止,得到最终的人体各部分投影矩阵Wq,作为最终的人体各部位运动特征;(6)对人体各部位运动特征进行级联,得到最终的人体运动特征;(7)重复上述步骤(2)~(6)分别对训练样本集X和测试样本集T中的所有视频提取特征并进行非负矩阵分解,获得训练样本特征集X'和测试样本特征集T';(8)利用支持向量机SVM算法对训练样本特征集X'进行训练学习得到分类器;再将测试样本特征集T'送入到分类器,得到各类运动的分类结果;所述步骤(3)中从训练视频集X中选取一个样本视频L,根据图结构模型提取人体各部位的运动兴趣点及相对应的运动特征,按如下步骤进行:(3a)检测运动兴趣点:(3a1)在空间维度上,对原始样本视频L进行二维高斯滤波,得到滤波后的视频数据I:I=L*g,其中,g为高斯平滑核,g的计算公式为:g=12πσ2e-x2+y22σ2,]]>其中,x,y为像素坐标,σ为空间维度的尺度参数;(3a2)在时间维度上,对视频I进行一维Gabor滤波,得到其在时间维度上的响应数据R:R=I*hev2*hod2,]]>其中,hev和hod是一维Gabor滤波器的一对正交,其定义公式如下:hev=-cos(2πtw)exp(-t2τ2),]]>hod=-sin(2πtw)exp(-t2τ2),]]>其中,τ为时间维度的尺度参数,ω=4/τ,t=2τ;(3a3)设定为响应数据R的阈值,将R大于阈值的点记为运动兴趣点;(3b)提取人体各部分的运动特征:(3b1)在人体各部分中,以检测到的运动兴趣点为中心,提取长为19,宽为3×3的视频时空块C;利用高斯平滑滤波对时空块C进行降噪处理,并计算时空块C的每一层梯度G,其中梯度G由数值r和方向θ组成;(3b2)对每层梯度G按照数值r由大到小进行排序,得到每一层的最大梯度Gm,并记录最大梯度Gm的数值rm和方向θm;(3b3)将时空块C中所有的最大梯度Gm的数值rm按照大小划分为5个区域,分别统计每个区域中数值rm的个数,将方向θm按照角度划分为12个区域,分别统计每个区域中θm的个数;在极坐标中表示出所有最大梯度Gm的数值rm和方向θm;(3b4)分别计算每个区域内数值rm和方向θm分布个数的百分比dr(j)和dθ(i);dr(j)=nr(j)/nr,dθ(i)=nθ(i)/nθ,其中,j表示数值r的第j个区域,j=1,……,5;nr(j)为第j区域中数值rm的个数,nr为全部数值rm的个数,i表示方向θm的第i区域,i=1,……,12;nθ(i)为第i区域中方向θm的个数,nθ为全部方向θm的个数;(3b5)将上述计算得到的各个区域内数值rm和方向θm的百分比dr(j)和dθ(i)进行级联,级联的结果作为对应时空快的统计梯度特征gi,则时空块对应部位的运动特征fi=gi;若某一部位包含多个时空块C,则该部位的运动特征为多个时空块的梯度统计特征gi的平均值:其中N为该部位所包含时空块的个数;若某一部位不包含时空块C,则用零补齐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410079746.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于滚筒体顶起装置
- 下一篇:一种黑茶饮料