[发明专利]基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法有效

申请号：	201511022492.5	申请日：	2015-12-30
公开（公告）号：	CN105654054B	公开（公告）日：	2018-12-04
发明（设计）人：	朱珂;许维纲;夏冰	申请（专利权）人：	上海颐本信息科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	郑州大通专利商标代理有限公司 41111	代理人：	陈大通
地址：	200233 上海市徐***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于监督近邻传播学习视觉词典模型智能视频分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法，其特征在于：包含如下步骤：

步骤1.针对视频样本，使用抽样保持策略提取关键视频帧；针对任意到达的视频帧，提取视频帧的摘要信息；将摘要信息与关键特征库进行匹配，若匹配成功，则将该视频帧判定为关键视频帧，否则，依概率p进行随机抽样，若抽中，则判定为关键视频帧，否则，丢弃该视频帧；

步骤2.针对关键视频帧，计算基于顺序度量的OM特征向量；

步骤3.利用基于半监督近邻传播学习对所有OM特征向量进行智能聚类，形成各个视频子簇；

步骤4.确定每个视频子簇对应的类别标签，构建多视觉词典，类别标签包含未知类型视频标签；

步骤5.将待检视频依次执行使用抽样保持策略提取关键视频帧和计算基于顺序度量的OM特征向量，并根据步骤4中的多视觉词典，依据最小距离法则判断待检视频的类别标签；

步骤6.若出现未知类型视频标签的视频个数大于设定阈值时，使用闭环反馈的自适应重构学习方法，返回步骤3，重构出能够适应新环境的多视觉词典，进一步判断待检视频的类别标签，否则，结束。

2.根据权利要求1所述的基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法，其特征在于：步骤2计算基于顺序度量的OM特征向量具体包含如下步骤：

步骤2.1、将关键视频帧转换成灰度图像；

步骤2.2、将灰度图像平均分割成N个图像块，其中，N＝Nx*Ny，其中，Nx代表X轴方向的图像块；Ny代表Y轴方向的图像块；

步骤2.3、计算每个图像块的平均亮度值I_k，即其中，f(x,y)是坐标为(x,y)的像素的亮度值，k∈[1,N]；m,n为图像块的行数和列数；步骤2.4、对各图像块平均亮度值进行排序，生成OM特征向量I＝[I₁,I₂,……,I_N]。

3.根据权利要求2所述的基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法，其特征在于：步骤3具体包含如下内容：

步骤3.1、针对已标记视频样本空间V_l、未标记视频样本空间V_nl，提取所有视频关键帧的OM特征向量；

步骤3.2、依次判断任意两个OM特征向量I_i、I_j是否属于V_l，若均属于V_l，且已标记视频属于同一类型，则将两个OM特征向量I_i、I_j的距离D_ij设为最大值0；若均属于V_l，且已标记视频不属于统一类型，则将两个I_i、I_j的距离D_ij设为最小值-∞；若I_i、I_j中至少有一个属于V_nl，则计算I_i、I_j的欧式距离D_ij；