[发明专利]一种基于二叉树的人体行为识别方法有效
申请号: | 201811555909.8 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109508698B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 李仲泓;吴昱焜;衣杨;沈金龙;佘滢;朱艺 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/778;G06T7/269 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510260 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二叉 人体 行为 识别 方法 | ||
本发明公开了一种基于二叉树的人体行为识别方法,应用于计算机视觉领域,旨在于解决现有技术中没有考虑到轨迹之间的相互关系以及对运动部分的特征提取不够细致的问题。本发明首先提取输入视频的综合显著轨迹;然后计算每条轨迹的特征描述符,包括新提出的均衡描述符;再利用谱聚类算法将视频的轨迹分成粒度不一的节点,构造中层语义二叉树;由于经费舍尔向量编码后的特征表示的维度过高,本发明采用子空间随机投影对编码向量进行降维;最终利用线性核的SVM(状态向量机)对特征表示分类,得到视频行为的类别标签。本方法在一定程度上移除背景的干扰,并提高了识别准确度。
技术领域
本发明涉及计算机视觉领域,更具体地,涉及一种基于二叉树的人体行为识别方法。
背景技术
基于特征的人体行为识别方法的方法流程大致包括轨迹采样、特征提取、特征编码和行为分类等步骤。在轨迹采样和特征提取阶段,现有的方法中表现良好的是改进密集轨迹方法(iDT,improved Dense Trajectory),这个方法会密集采样特征点并对其进行跟踪,选取显著的轨迹,再提取出轨迹的特征描述符。该方法能够根据视频帧中的RGB特征提取出显著的轨迹,以及具有表现力的描述符MBH(运动边界直方图)、HOG(方向直方图)、HOF(光流直方图)。然而,iDT方法在采样时没有考虑到光流特征,以及描述符也没有考虑到轨迹之间的相互关系,因而准确率仍未达到令人满意的水平。除此之外,在编码该方法时也是简单地把所有特征进行编码,而研究表明人的运动可以分为运动主体和该运动主体的辅助部分,因此在编码的时候可以将特征分为两类,做到更加细致地提取特征的中层语义。
发明内容
本发明为克服上述现有技术采样时没有考虑到光流特征,描述符没有考虑到轨迹之间的相互关系以及对运动部分的特征提取不够细致的缺陷,提供一种基于二叉树的人体行为识别方法。
为解决上述技术问题,本发明的技术方案如下:一种基于二叉树的人体行为识别方法,包括与以下步骤:
S1:输入视频,对视频帧中的特征点进行采样,对采样后的特征点进行跟踪,生成轨迹,再对轨迹进行筛选;
S2:计算筛选后轨迹的显著值,提取出综合显著轨迹;
S3:根据求得的综合显著轨迹计算轨迹的特征描述符,用来量化轨迹特征;
S4:根据轨迹特征将轨迹进行分类,并利用谱聚类方法将视频的轨迹分类到若干集合中,即分类到二叉树节点中,构造中层语义二叉树;
S5:对若干集合内的轨迹进行编码得到编码向量,采用子空间随机投影对编码向量进行降维,并将若干集合的降维后的编码向量进行融合,用来表示一个视频;
S6:利用线性核的SVM对视频进行分类,得到视频行为的类别标签并输出结果。
优选地,S1的具体步骤为:
S11:利用3×3的Sobel算子计算视频帧中每一个像素点的梯度,得到该视频帧两个方向上的梯度矩阵Dx和Dy;
S12:选取像素点p的3×3邻域S(p)内的梯度自相关矩阵的最小特征值作为该像素点的特征值;
S13:选择特征值大于特征点阈值的像素点作为特征点,阈值大小为所有像素点的特征值中最小的值的倍数;
S14:按照设定的步长将视频帧划分为网格,并对其中存在的特征点进行采样,选取特征值大于预设的起点特征点阈值的特征点作为轨迹的起点;
S15:以缩放因子对原始视频帧进行八个尺度的缩小,生成八层金字塔;
S16:采用光流场进行特征点跟踪,生成轨迹:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811555909.8/2.html,转载请声明来源钻瓜专利网。