[发明专利]基于合成描述子的人体动作识别方法及系统有效

申请号：	201510195277.9	申请日：	2015-04-22
公开（公告）号：	CN104794446B	公开（公告）日：	2017-12-12
发明（设计）人：	谌先敢;刘海华;高智勇;刘李漫	申请（专利权）人：	中南民族大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京捷诚信通专利事务所(普通合伙)11221	代理人：	王卫东
地址：	430074 湖北***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于合成描述人体动作识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机视觉和视频监控领域，具体是涉及一种基于合成描述子的人体动作识别方法及系统。

背景技术

基于视频的人体动作识别是一个非常重要的问题，可应用于视频监控、视频检索和人机交互。人体动作识别是指用计算机从视频中区分出人体动作的类别。

基于视频的人体动作识别可以分为两个部分：动作的表示和动作的分类。动作的表示是指从包含人体动作的视频中提取合适的特征数据来描述人体的动作。动作的分类，是指从训练数据学习得到分类模型，将测试集中表示这些人体动作的特征数据进行分类。

目前的动作识别方法有全局方法和局部方法。全局方法，首先需要定位人体，然后将感兴趣区域编码为一个整体，形成特征描述子。全局表示法中一般通过背景相减方法或者人体检测器来定位人体。由于提取方法一般都是不完善的，因此侧影会包含一些噪声，并且对视角变化敏感。全局方法有全局性，该特性使其对类内变化和变形敏感。局部方法被描述为局部小块的一个集合，首先探测时空兴趣点或者得到密集采样点，然后在点的周围计算局部小块，合并成为一个描述子。局部方法对视角、噪声和部分遮挡具有某种程度的不变性，并不严格需要背景相减或人体检测。然而，他们依靠足够相关兴趣点的提取或者需要得到密集采样点，有时需要预处理。

目前最佳的动作识别方法是一种局部方法，称为结合密集轨迹的运动边界描述子，该方法提取密集轨迹，并计算运动边界描述子。但是该方法需要计算视频中全部帧的光流，运算量较大，而且该方法只包含局部信息，不包含全局信息。

发明内容

本发明的目的是为了克服上述背景技术的不足，提供一种基于合成描述子的人体动作识别方法及系统，从视频中提取三种合成描述子的局部特征和全局特征，运算量较小，能够快速识别人体动作。

本发明提供一种基于合成描述子的人体动作识别方法，包括以下步骤：

A、提取所有视频的三种合成描述子：视频分为训练视频和待识别视频，对于每一个视频，提取该视频中位于不同时间点上的信息，组合成一幅图像，得到该视频的合成描述子；合成描述子有三种：图像合成描述子、累积梯度合成描述子、光流合成描述子；在人体动作的识别过程中，使用这三种合成描述子的局部特征和全局特征来表征人体的动作，这三种合成描述子的局部特征和全局特征互为补充；

B、计算待识别视频的三种合成描述子的局部特征的支持向量机SVM分数；

C、计算待识别视频的三种合成描述子的全局特征的SVM分数；

D、根据待识别视频的三种合成描述子的局部特征的SVM分数、全局特征的SVM分数得到综合分数，再根据综合分数得到待识别视频中人体动作的识别结果。

在上述技术方案的基础上，步骤A中提取视频的图像合成描述子的过程为：对视频进行时间采样，得到16帧不同的图像；再将这16帧不同的图像依次排列成4行4列，组合成一帧图像，得到该视频的图像合成描述子。

在上述技术方案的基础上，步骤A中提取视频的累积梯度合成描述子的过程为：对视频进行时间采样，得到16个不同的图像序列片段，这16个图像序列片段中心位置的图像位于视频的16个等间隔的时间节点，每个图像序列片段由视频中相邻的8帧图像组成；对于每个图像序列片段，计算该图像序列片段中每一帧图像的梯度，累积到一帧中，得到累积梯度图像；有16个图像序列片段，共得到16帧累积梯度图像；将16帧累积梯度图像，依次排列成4行4列，组合成一帧图像，得到该视频的累积梯度合成描述子。

在上述技术方案的基础上，所述累积梯度图像的计算过程如下：

步骤101、图像序列片段中包括若干帧图像，图像序列片段中所有图像的梯度图都累积到一帧图像上得到的累积梯度图像为H(x,y,t)，x为点(x,y)的横坐标，y为点(x,y)的纵坐标，t为时间，累积梯度图像H(x,y,t)的尺寸与图像序列片段中原始图像的大小相等；初始化累积梯度图像H(x,y,t)，将累积梯度图像H(x,y,t)的全部像素置为0，此时时间t为0；将图像序列片段中的第一帧作为当前帧I(x,y)；

步骤102、计算当前帧I(x,y)的梯度图像幅值G(x,y)；t-1时刻的累积梯度图像为H(x,y,t-1)，将G(x,y)与H(x,y,t-1)在每一个像素点上进行比较，取灰度值较大的像素点的灰度值作为H(x,y,t)的新值；在点(x,y)处，t时刻的累积梯度图像H(x,y,t)＝max[H(x,y,t-1)，G(x,y)]；

步骤103、将下一帧作为当前帧，返回步骤102，直到图像序列片段的最后一帧。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中南民族大学，未经中南民族大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510195277.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种交叉事件自动化测试方法和装置
下一篇：用于超大面阵拼接CMOS图像传感器的复用型像元控制电路

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于合成描述子的人体动作识别方法及系统有效

专利文献下载