[发明专利]视频分类方法、介质、装置和计算设备有效
申请号: | 202010130234.3 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111339364B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 姜波;于佳弘;周磊;吴凯琳 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06V20/40;G06V10/764;G06V10/82;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;杨瑾瑾 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 介质 装置 计算 设备 | ||
1.一种视频分类方法,其特征在于,包括:
分别获取视频帧序列的表征特征和运动特征;
将所述表征特征作为解码网络的表征支路的第一级Transformer结构的Query,并将所述运动特征分别作为所述表征支路的第一级Transformer结构的Key和Value,采用所述表征支路的第一级Transformer结构进行计算,得到补充了运动特征的表征特征;
将所述运动特征作为所述解码网络的运动支路的第一级Transformer结构的Query,并将所述表征特征分别作为所述运动支路的第一级Transformer结构的Key和Value,采用所述运动支路的第一级Transformer结构进行计算,得到补充了表征特征的运动特征;
将所述补充了运动特征的表征特征与补充了表征特征的运动特征进行融合;
根据所述融合的结果对所述视频帧序列的类别进行预测。
2.根据权利要求1所述的方法,其特征在于,所述表征支路及所述运动支路分别还包括至少一个后续级Transformer结构,所述表征支路及所述运动支路的第一级Transformer结构与各个所述后续级Transformer结构依次连接;
所述方法还包括:
针对所述表征支路的任意一个所述后续级Transformer结构,将所述表征支路中前一级Transformer结构的计算结果作为所述后续级Transformer结构的Query,并将所述运动支路中前一级Transformer结构的计算结果作为所述后续级Transformer结构的Key和Value,采用所述后续级Transformer结构进行计算;将所述表征支路中最后一个所述后续级Transformer结构的计算结果作为所述补充了运动特征的表征特征;
针对所述运动支路的任意一个所述后续级Transformer结构,将所述运动支路中前一级Transformer结构的计算结果作为所述后续级Transformer结构的Query,并将所述表征支路中前一级Transformer结构的计算结果作为所述后续级Transformer结构的Key和Value,采用所述后续级Transformer结构进行计算;将所述运动支路中最后一个所述后续级Transformer结构的计算结果作为所述补充了表征特征的运动特征。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
对所述第一级Transformer结构/后续级Transformer结构的计算结果进行层归一化处理;
对层归一化处理之后的结果进行语义特征转换;
将语义特征转换之后的结果通过残差结构与所述层归一化处理之后的结果相加,所述残差结构中包含Dropout层;
对通过残差结构相加之后的结果进行层归一化处理,采用处理结果更新所述第一级Transformer结构/后续级Transformer结构的计算结果。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
将视频数据均匀划分为多段视频帧;
分别从每段所述视频帧中抽取一个视频帧;
将所述抽取的视频帧组成所述视频帧序列。
5.根据权利要求4所述的方法,其特征在于,所述分别获取视频帧序列的表征特征和运动特征,包括:
分别获取所述视频帧序列的表征信息数据和运动信息数据;
对所述表征信息数据和所述运动信息数据进行编码及空间维度压缩,得到所述视频帧序列的表征特征和运动特征。
6.根据权利要求5所述的方法,其特征在于,获取所述视频帧序列的表征信息数据,包括:
对所述视频帧序列中的各帧进行数据预处理,得到所述视频帧序列的表征信息数据。
7.根据权利要求5所述的方法,其特征在于,获取所述视频帧序列的运动信息数据,包括:
将所述视频帧序列中的相邻帧/相邻帧的边缘信息相减,得到所述视频帧序列的运动信息数据;所述相邻帧的边缘信息采用高频算子进行提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010130234.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种梭式接线专用钳子及其使用方法
- 下一篇:操作控制方法及电子设备