[发明专利]一种视频识别方法和相关装置有效

申请号：	202011078362.4	申请日：	2020-10-10
公开（公告）号：	CN112203115B	公开（公告）日：	2023-03-10
发明（设计）人：	蔡聪怀;刘振华;饶峰云;赵教生;林炯;刘叶青	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	H04N21/234	分类号：	H04N21/234;H04N21/44;H04N21/845
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王兆林
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频识别方法相关装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频识别方法，其特征在于，所述方法包括：

获取待识别视频的视频帧片段，所述视频帧片段包括连续的多个视频帧；

提取所述视频帧片段的时空特征；其中，所述时空特征为所述视频帧片段的空间特征和所述视频帧片段的时间特征的融合特征，表征所述视频帧片段中涉及物体的动作信息，所述空间特征用于标识所述视频帧片段的每一帧视频帧中涉及的物体的外形信息，所述时间特征用于标识所述视频帧片段中涉及的物体的运动信息；

将所述视频帧片段的时空特征与检索库中的时空特征进行匹配，若匹配成功，则获取所述匹配成功的检索库中的时空特征，确定所述匹配成功的检索库中的时空特征对应的视频帧片段所在的目标视频，将所述目标视频的名称确定为所述待识别视频的名称；其中，所述检索库包括所述目标视频的多个视频帧片段的时空特征，所述目标视频为所述待识别视频对应的完整视频。

2.根据权利要求1所述的方法，其特征在于，所述提取所述视频帧片段的时空特征，包括：

将所述视频帧片段输入到特征提取模型的空间卷积层中，获取所述视频帧片段中每一帧视频帧的空间特征；

将所述视频帧片段中每一帧视频帧的空间特征输入到所述特征提取模型的第一融合层中，获得所述视频帧片段的空间特征，将所述视频帧片段输入到所述特征提取模型的第一融合层中，获得所述视频帧片段的时间特征；

将所述视频帧片段的空间特征和所述视频帧片段的时间特征输入到所述特征提取模型的第二融合层，获得所述视频帧片段的时空特征。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

在训练所述特征提取模型时，构建样本视频帧片段的多个片段，所述多个片段包括针对所述样本视频帧片段的不同分辨率和/或不同宽高比的视频帧片段；

将所述样本视频帧片段的多个片段作为样本数据输入到特征提取模型中进行训练。

4.根据权利要求1-3任意一项所述的方法，其特征在于，当所述待识别视频具有遮挡物时，所述方法还包括：

识别所述待识别视频中的动态区域和静态区域，所述静态区域为所述待识别视频中所述遮挡物所在的区域；

去除所述待识别视频中的所述静态区域。

5.根据权利要求1-3任意一项所述的方法，其特征在于，所述获取所述匹配成功的检索库中的时空特征，包括：

获取所述匹配成功的检索库中的时空特征，确定所述匹配成功的检索库中的时空特征对应的视频帧片段；