[发明专利]基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法有效
申请号: | 201511022492.5 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105654054B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 朱珂;许维纲;夏冰 | 申请(专利权)人: | 上海颐本信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈大通 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 近邻 传播 学习 视觉 词典 模型 智能 视频 分析 方法 | ||
1.一种基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法,其特征在于:包含如下步骤:
步骤1.针对视频样本,使用抽样保持策略提取关键视频帧;针对任意到达的视频帧,提取视频帧的摘要信息;将摘要信息与关键特征库进行匹配,若匹配成功,则将该视频帧判定为关键视频帧,否则,依概率p进行随机抽样,若抽中,则判定为关键视频帧,否则,丢弃该视频帧;
步骤2.针对关键视频帧,计算基于顺序度量的OM特征向量;
步骤3.利用基于半监督近邻传播学习对所有OM特征向量进行智能聚类,形成各个视频子簇;
步骤4.确定每个视频子簇对应的类别标签,构建多视觉词典,类别标签包含未知类型视频标签;
步骤5.将待检视频依次执行使用抽样保持策略提取关键视频帧和计算基于顺序度量的OM特征向量,并根据步骤4中的多视觉词典,依据最小距离法则判断待检视频的类别标签;
步骤6.若出现未知类型视频标签的视频个数大于设定阈值时,使用闭环反馈的自适应重构学习方法,返回步骤3,重构出能够适应新环境的多视觉词典,进一步判断待检视频的类别标签,否则,结束。
2.根据权利要求1所述的基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法,其特征在于:步骤2计算基于顺序度量的OM特征向量具体包含如下步骤:
步骤2.1、将关键视频帧转换成灰度图像;
步骤2.2、将灰度图像平均分割成N个图像块,其中,N=Nx*Ny,其中,Nx代表X轴方向的图像块;Ny代表Y轴方向的图像块;
步骤2.3、计算每个图像块的平均亮度值Ik,即其中,f(x,y)是坐标为(x,y)的像素的亮度值,k∈[1,N];m,n为图像块的行数和列数;步骤2.4、对各图像块平均亮度值进行排序,生成OM特征向量I=[I1,I2,……,IN]。
3.根据权利要求2所述的基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法,其特征在于:步骤3具体包含如下内容:
步骤3.1、针对已标记视频样本空间Vl、未标记视频样本空间Vnl,提取所有视频关键帧的OM特征向量;
步骤3.2、依次判断任意两个OM特征向量Ii、Ij是否属于Vl,若均属于Vl,且已标记视频属于同一类型,则将两个OM特征向量Ii、Ij的距离Dij设为最大值0;若均属于Vl,且已标记视频不属于统一类型,则将两个Ii、Ij的距离Dij设为最小值-∞;若Ii、Ij中至少有一个属于Vnl,则计算Ii、Ij的欧式距离Dij;
步骤3.3、将视频样本空间中的n个样本点任意两者的距离存储在矩阵E中;步骤3.4、基于近邻传播原理进行聚类划分,形成K个聚簇C={C1,…,CK}。
4.根据权利要求3所述的基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法,其特征在于:步骤4具体包含如下内容:
步骤4.1、针对任意视频子簇Ci,计算Ci中属于任意类别标签lj的已标记视频帧的个数Ni;
步骤4.2、利用多数投票策略,将包含最多样本的类别标签l*赋给子簇Ci;
步骤4.3、计算视频子簇Ci的质心wi,即为类别标签l*的视觉码本Wi;
步骤4.4、所有视觉码本构成多视觉词典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海颐本信息科技有限公司,未经上海颐本信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511022492.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图片内容的图片审核系统及图片审核方法
- 下一篇:一种视频检测方法及系统