[发明专利]音视频同步判别方法、装置、电子设备及存储介质在审
申请号: | 202210780467.7 | 申请日: | 2022-07-04 |
公开(公告)号: | CN115187899A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 吴大江;裴积全 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06V10/80;G06V10/774;G06V10/764;G10L25/24;G10L25/30;G10L25/51;G10L25/57 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗岚 |
地址: | 100176 北京市北京经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 同步 判别 方法 装置 电子设备 存储 介质 | ||
1.一种音视频同步判别方法,其特征在于,包括:
获取待判别的原始音频片段和原始视频片段,并从中获取多组在时间维度上对齐的局部音频片段和局部视频片段;
针对每一组,获取所述局部音频片段的音频特征和所述局部视频片段的视频特征,并基于所述音频特征和所述视频特征,获取该组的融合特征;
基于多组的所述融合特征,判断所述原始音频片段和所述原始视频片段是否同步。
2.根据权利要求1所述的方法,其特征在于,所述基于多组的所述融合特征,判断所述原始音频片段和所述原始视频片段是否同步,包括:
基于多组的所述融合特征和训练好的目标分类器,对所述原始音频片段和所述原始视频片段进行同步分类预测,获取预测结果,所述预测结果指示所述原始音频片段和所述原始视频片段是否同步。
3.根据权利要求1所述的方法,其特征在于,所述从中获取多组在时间维度上对齐的局部音频片段和局部视频片段,包括:
确定从所述原始视频片段中提取的所述局部视频片段的视频帧数,并按照所述视频帧数,从所述原始视频片段中提取所述局部视频片段;
确定从所述原始音频片段中提取的所述局部音频片段的音频帧数,并按照所述音频帧数,从所述原始音频片段中获取所述局部音频片段。
4.根据权利要求3所述的方法,其特征在于,所述音频帧数的获取过程,包括:
获取所述原始视频片段的视频帧率和所述局部视频片段的视频帧数;
获取所述原始音频片段的音频采样率;
基于所述视频帧率、所述视频帧数和所述音频采样率,确定所述局部音频片段的音频帧数。
5.根据权利要求2所述的方法,其特征在于,所述基于多组的所述融合特征和训练好的目标分类器,对所述原始音频片段和所述原始视频片段进行同步分类预测,包括:
基于多组的所述融合特征,得到待识别特征序列;
将所述待识别特征序列输入目标分类器,所述目标分类器的特征提取层对所述待识别特征序列进行全局关系提取,以获取全局特征;
将所述全局特征输入所述目标分类器的感知层,由所述感知层基于所述全局特征,对所述原始音频片段和所述原始视频片段进行同步分类预测,获取所述预测结果。
6.根据权利要求5所述的方法,其特征在于,所述基于多组的所述融合特征,得到待识别特征序列,包括:
对多帧所述融合特征按照时间顺序进行排列,获取第一特征序列。
7.根据权利要求5所述的方法,其特征在于,所述基于多组的所述融合特征,得到待识别特征序列,包括:
响应于所述融合特征为所述音频特征和所述视频特征拼接,将多组的所述融合特征中的所述音频特征,按照时间顺序进行排列,获取第一特征子序列;
将多组的所述融合特征中的所述视频特征,按照时间顺序进行排列,获取第二特征子序列;
基于所述第一特征子序列和所述第二特征子序列,生成第二特征序列。
8.根据权利要求2-7任一项所述的方法,其特征在于,所述目标分类器的训练过程,包括:
获取样本音频片段、样本视频片段和标签数据,所述标签数据用于指示所述样本音频片段和样本视频片段是否同步;
获取所述样本音频片段的样本音频特征和所述样本视频片段的样本视频特征;
基于所述样本音频特征和所述样本视频特征,获取样本融合特征;
基于所述样本融合特征,对初始分类器进行训练,以得到目标分类器。
9.根据权利要求8所述的方法,其特征在于,所述样本音频片段和所述样本视频片段包括正样本和负样本,所述正样本的获取过程包括:
将同一样本的音频和视频在时间维度上依序切分,获取所述正样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210780467.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于室内试验的土体入渗计算与边坡分析方法
- 下一篇:改进型晶体切片设备