[发明专利]基于混沌不变量的动态纹理识别方法无效
申请号: | 201210398636.7 | 申请日: | 2012-10-18 |
公开(公告)号: | CN102915451A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 胡士强;王勇 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 张泽纯 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混沌 不变量 动态 纹理 识别 方法 | ||
技术领域
本发明涉及的是一种计算机模式识别技术领域的分类方法,具体地说,涉及的是一种基于混沌不变量的动态纹理识别方法。
背景技术
动态纹理是计算机视觉与模式识别领域的研究热点,我们日常所见到的烟雾,河水,火焰等都可以看作是动态纹理。视频图像中对动态纹理分类在民用和军用上均具有广泛的应用前景。针对这个问题,国内外学者提出了很多方法,主要的研究方法可以分为三种:基于物理方法是将动态纹理的第一个主成分建成模型。这个模型可以用于纹理合成,如合成烟,水等。这种方法的缺点是它是针对某一类特例的动态纹理,因此很难用于对多个类别的动态纹理识别。第二种方法是基于图像的方法。这种方法主要是提取图像与图像之间的运动信息,如提取正则流,光流。这些运动信息的提取需要基于局部平滑和亮度一直的假设。因此对于不满足上述假设的视频,此方法很难凑效。第三种方法是统计模型的方法。它是同时对动态纹理的空间信息和统计信息进行学习。
经对现有技术文献的检索发现,Soatto,S.等在《International Journal of computer vision》(pp.91-109,2003)上发表“Dynamic Textures”(动态纹理,计算机视觉)。该文提出了用线性系统来对动态纹理建模,通过对模型分类,来达到对动态纹理的识别分类。线性系统基于马尔科夫性质的,即当前时刻的观测值受制于前一时刻的观测值,而且系统是线性的。但是我们所遇到的动态纹理视频并不能保证具有马尔科夫性质或者线性的性质。S.Ali等在《IEEE International Conference on Computer Vision》(2007)上发表“Chaotic invariants for human action recognition”(基于混沌特征的动作识别,IEEE计算机视觉国际会议)。该文将人的动作轨迹转换为混沌特征量,取得了很好的识别效果。但是此文用到的混沌特征量是描述系统的运动状态的,并不能用来对动态纹理进行识别。
发明内容
本发明的目的在于针对上述现有技术中存在的不足,提出一种基于混沌不变量的动态纹理识别方法,应用于动态纹理模式分类问题,主要的创新点包括:1)将视频每个位置随时间变化的像素看作混沌时间序列。应用混沌理论来得到混沌时间序列的相关特征量,并组成一个新的特征向量来描述混沌时间序列。这样每个像素点都用一个特征向量来描述,视频就可以用一个特征矩阵来表示;2)通过实验验证,本文提出的特征向量能够很好的对动态纹理进行描述;3)用两个分类算法(基于词袋的分类算法(bag of word(BOW))和基于地球移动距离earth mover’s distance(EMD)的分类算法)来对特征矩阵分类:(a)用meanshift对每个特征矩阵分割,然后用EMD算法来比较每个特征矩阵之间的相似度,然后用K最近邻(k-nearest neighbor(KNN))算法对特征矩阵分类;(b)用BOW方法,即先将所有特征矩阵组成一个矩阵,用kmeans聚类得到各个聚类中心,然后计算各个特征矩阵含有多少个聚类中心,通过KNN将特征矩阵分类。这两个算法在动态纹理识别试验中取得了较高的识别率。
本发明是通过以下技术方案实现的:
一种基于混沌不变量的动态纹理识别算法,其特点在于采用了混沌特征量来描述动态纹理,该方法包括如下步骤:
第一步,将视频里面每个随时间变化的像素点看作一个混沌时间序列。计算每个混沌时间序列的嵌入维数,嵌入时间延迟,盒维数,信息维数,关联维数,平均值和方差。将上面计算得到的特征向量组成一个特征向量,视频的每个像素点位置就由这个特征向量来表示。这样一个视频就变成了一个特征向量矩阵;
第二步,根据第一步中得到的特征向量矩阵,利用均值漂移(meanshift)算法对这个特征向量矩阵聚类。相比于传统的k-均值(k-means)算法,混合高斯建模(Gaussian mixture model),meanshift算法只需要一个带宽参数,即可对特征向量聚类,并且可以对非高斯情形聚类,对噪声也有一定的抗干扰作用。
然后用EMD距离来比较meanshift聚类结果。EMD算法是基于解决运输问题(transportation problem)的经典算法。本发明中用EMD算法来比较两个特征向量矩阵之间的差异。分别计算每个特征向量矩阵与其它特征向量矩阵的EMD距离,从而得到一个EMD比较结果矩阵。这个EMD比较矩阵中的每个数值即为相应的横向坐标代表的视频和纵向坐标代表的视频之间的距离,距离越小,代表两个视频越接近,每个视频跟自己的EMD距离为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210398636.7/2.html,转载请声明来源钻瓜专利网。