[发明专利]一种视频识别方法和相关装置有效
申请号: | 202011078362.4 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112203115B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 蔡聪怀;刘振华;饶峰云;赵教生;林炯;刘叶青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44;H04N21/845 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 识别 方法 相关 装置 | ||
1.一种视频识别方法,其特征在于,所述方法包括:
获取待识别视频的视频帧片段,所述视频帧片段包括连续的多个视频帧;
提取所述视频帧片段的时空特征;其中,所述时空特征为所述视频帧片段的空间特征和所述视频帧片段的时间特征的融合特征,表征所述视频帧片段中涉及物体的动作信息,所述空间特征用于标识所述视频帧片段的每一帧视频帧中涉及的物体的外形信息,所述时间特征用于标识所述视频帧片段中涉及的物体的运动信息;
将所述视频帧片段的时空特征与检索库中的时空特征进行匹配,若匹配成功,则获取所述匹配成功的检索库中的时空特征,确定所述匹配成功的检索库中的时空特征对应的视频帧片段所在的目标视频,将所述目标视频的名称确定为所述待识别视频的名称;其中,所述检索库包括所述目标视频的多个视频帧片段的时空特征,所述目标视频为所述待识别视频对应的完整视频。
2.根据权利要求1所述的方法,其特征在于,所述提取所述视频帧片段的时空特征,包括:
将所述视频帧片段输入到特征提取模型的空间卷积层中,获取所述视频帧片段中每一帧视频帧的空间特征;
将所述视频帧片段中每一帧视频帧的空间特征输入到所述特征提取模型的第一融合层中,获得所述视频帧片段的空间特征,将所述视频帧片段输入到所述特征提取模型的第一融合层中,获得所述视频帧片段的时间特征;
将所述视频帧片段的空间特征和所述视频帧片段的时间特征输入到所述特征提取模型的第二融合层,获得所述视频帧片段的时空特征。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在训练所述特征提取模型时,构建样本视频帧片段的多个片段,所述多个片段包括针对所述样本视频帧片段的不同分辨率和/或不同宽高比的视频帧片段;
将所述样本视频帧片段的多个片段作为样本数据输入到特征提取模型中进行训练。
4.根据权利要求1-3任意一项所述的方法,其特征在于,当所述待识别视频具有遮挡物时,所述方法还包括:
识别所述待识别视频中的动态区域和静态区域,所述静态区域为所述待识别视频中所述遮挡物所在的区域;
去除所述待识别视频中的所述静态区域。
5.根据权利要求1-3任意一项所述的方法,其特征在于,所述获取所述匹配成功的检索库中的时空特征,包括:
获取所述匹配成功的检索库中的时空特征,确定所述匹配成功的检索库中的时空特征对应的视频帧片段;
根据所述对应的视频帧片段在所述目标视频中的定位区间,获得所述待识别视频在所述目标视频中的定位区间。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若多个待识别视频对应同一个目标视频,则获取所述多个待识别视频的定位区间;
根据所述多个待识别视频的定位区间,将所述多个待识别视频进行排序。
7.根据权利要求5所述的方法,其特征在于,所述获得所述待识别视频在所述目标视频中的定位区间,包括:
获得所述待识别视频在所述目标视频中的第一定位区间;
为所述第一定位区间增加预设时间段,获得第二定位区间;
基于所述第二定位区间,将所述视频帧片段的时空特征与所述目标视频的时空特征进行匹配;
若匹配成功,则获取所述匹配成功的目标视频的时空特征对应的视频帧片段;
根据所述对应的视频帧片段在所述目标视频中的定位区间,获得所述待识别视频在所述目标视频中的定位区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011078362.4/1.html,转载请声明来源钻瓜专利网。