[发明专利]基于相对梯度的ISA模型的行为识别方法有效
申请号: | 201210578578.6 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103065158A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 刘启和;陈雷霆;蔡洪斌;邱航;肖燕霞;周川 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 成都中亚专利代理有限公司 51126 | 代理人: | 陈亚石 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相对 梯度 isa 模型 行为 识别 方法 | ||
技术领域
本发明涉及基于相对梯度的ISA模型的行为识别方法。
背景技术
行为识别是在计算机视觉和模式识别领域备受关注并具挑战性的一个研究方向。行为识别任务不只是实现对人或者虚拟现实中机器人行为的识别,还有比如说对车辆、坦克等的加速、停止、左转、右转等行为的识别等等,在安全监控,战场演习、人机交互,基于行为的视频检索等方面有广泛的应用背景。
行为识别是在成功实现视频图像序列中的跟踪,完成特征提取的基础上进行的,属于更高一层的视觉任务。独立子空间分析(independent subspace analysis, ISA)是一种可以用于特征提取的无监督学习模型。独立子空间分析模型是独立分量分析(independent component analysis, ICA)模型的一个扩展模型。它是一种能够有效地模拟人类视觉系统中V1区简单细胞与复杂细胞感受野的响应模式的层次化结构模型,并利用ISA对大量的视频数据样本进行无监督学习,获取具有统计独立性与稀疏特性的视频基元,被认为是一种有效的视频图像统计分析方法,对于提取视频中的局部特征也是一种很有效的方法。
公开号为CN 101334845 A的专利公开了一种基于轨迹序列分析和规则归纳的视频行为识别方法,该专利主要是解决了固定摄像机场景中利用计算机自动学习频繁发生的运动事件规则,并对感兴趣的行为进行自动识别的问题,主要用于智能监控。但是如果要检测的视频中不是固定摄像机拍摄的,场景信息比较多,对场景进行分割,需要花费一定的时间;或者如果要检测的视频中行为模式比较复杂,采用隐马尔科夫模型(HMM)进行建模,高效性可能就会降低。
公开号为CN 102306301 A的专利申请文件虽然解决了现有的仿生模型目标识别速度低的问题。但它仍然存在许多不足的地方,比如只考虑了视觉皮层V1中复杂细胞的基本属性,而其他特性如环绕抑制等没有考虑。
对基于视觉的行为识别而言,从视频图像序列中抽取出能够合理表示视频中实体的行为数据至关重要。目前人的行为表示方法根据特征提取方法不同分为基于表观的表示方法和基于人体模型的表示方法。基于表观的表示方法不是对人体物理结构直接建模,而是直接计算感兴趣区域的简单2D表观表示,如从视频图像序列中提取人的运动轨迹信息、人的轮廓特征或者直接利用图像信息进行分析。如前述现有技术一(公开号:CN 101334845 A)、技术二(公开号:CN 102306301 A)就是基于表观的表示方法,这类表示方法容易计算,易于实时。人体模型主要有三种:线图模型、2D模型和3D模型,其中3D模型由于复杂度较高,很少用于人的行为识别中。虽然基于人体模型的表示方法可以提高行为识别的准确度,但是它的计算量大、复杂度很高和算法鲁棒性差。
发明内容
鉴于上述不足之处,本发明的目的在于提供一种基于相对梯度的ISA模型的行为识别方法,该方法采用改进的独立子空间分析算法来提取视频的局部特征;接着对所提取的局部特征进行聚类,得到聚类中心(即视觉关键词),对每个视频,建立视觉关键词直方图,则每个视频表示为基于视觉关键词直方图的特征向量;最后就是采用多类别支持向量机SVM对其进行分类,完成对行为的识别。本发明可以用于个体行为识别,也可以用于群体行为识别。本发明为一种基于相对梯度的算法,不需要求逆过程,收敛速度更快。
为了达到上述目的,本发明采用了以下技术方案:
一种基于相对梯度的ISA模型的行为识别方法,其特征在于:该行为识别方法包括以下步骤:
步骤1:样本数据的预处理;
步骤2:特征提取;
步骤3:特征聚类;
步骤4:分类/识别。
具体为:
步骤1:样本数据的预处理。
步骤1.1 首先,采集大量具有视觉行为模式的视频集合,假设选取N个视频样本进行采样。
步骤1.2 然后,把每个视频样本随机地分割为num_patches个视频块,每个视频块的大小为 sp_size×sp_size×tp_size,将分割的所有视频块组成一个样本矩阵X,表示成:X={x1,x2,…,xN*num_patches},其中N是视频样本的个数,num_patches表示对每个视频分割的视频块的数量,每一列向量表示一个视频块数据,维数为sp_size2×tp_size。
步骤1.3 最后,对步骤1.2得到的样本矩阵X进行特征中心化、数据白化的处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210578578.6/2.html,转载请声明来源钻瓜专利网。