[发明专利]提取关键帧的方法及装置有效
申请号: | 201911335651.5 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111177460B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 梁涛;张晗;马连洋;衡阵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/75;G06N3/0464;G06N3/08 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 朱黎 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 关键 方法 装置 | ||
1.一种提取关键帧的方法,其特征在于,包括:
通过神经网络模型为样本视频进行关键帧预测,得到所述样本视频的预测关键帧,并根据所述预测关键帧和为所述样本视频标注的标注关键帧之间的差异计算得到所述样本视频所对应的第一损失;
通过所述神经网络模型为所述样本视频进行内容类型预测,得到所述样本视频的预测类型,并根据所述预测类型和为所述样本视频标注的标注类型之间的差异计算得到所述样本视频所对应的第二损失;
根据所述第一损失和所述第二损失对所述神经网络模型进行训练,得到关键帧提取模型;
获取目标视频;
将所述目标视频作为所述关键帧提取模型的输入,通过所述关键帧提取模型预测得到所述目标视频的关键帧。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一损失和所述第二损失对所述神经网络模型进行训练,得到关键帧提取模型,包括:
根据所述第一损失和所述第二损失计算得到目标损失;
根据所述目标损失对所述神经网络模型的参数进行调整,直至满足收敛条件得到关键帧提取模型。
3.根据权利要求2所述的方法,其特征在于,所述神经网络模型包括卷积神经网络层,所述通过神经网络模型为样本视频进行关键帧预测,得到所述样本视频的预测关键帧,并根据所述预测关键帧和为所述样本视频标注的标注关键帧之间的差异计算得到所述样本视频所对应的第一损失,包括:
通过所述卷积神经网络层对所述样本视频中的视频帧进行特征提取,获得各视频帧的内容特征向量;
根据所述各视频帧的内容特征向量进行关键帧预测,得到所述样本视频的预测关键帧;
根据所述预测关键帧和为所述样本视频标注的标注关键帧计算得到所述第一损失。
4.根据权利要求3所述的方法,其特征在于,所述通过所述卷积神经网络层对所述样本视频中的视频帧进行特征提取,获得各视频帧的内容特征向量之前,所述方法还包括:
对所述样本视频进行分帧,得到所述样本视频的视频帧。
5.根据权利要求3所述的方法,其特征在于,所述神经网络模型还包括双向门控循环层、第一全连接层和第一分类层,所述根据所述各视频帧的内容特征向量进行关键帧预测,得到所述样本视频的预测关键帧,包括:
通过所述双向门控循环层对各视频帧的内容特征向量进行关联特征提取,获得各视频帧的关联特征向量;
通过所述第一全连接层对所述各视频帧的关联特征向量进行变换,获得第一特征向量;
通过所述第一分类层根据所述第一特征向量预测得到所述预测关键帧。
6.根据权利要求5所述的方法,其特征在于,所述通过所述神经网络模型为所述样本视频进行内容类型预测,得到所述样本视频的预测类型,并根据所述预测类型和为所述样本视频标注的标注类型之间的差异计算得到所述样本视频所对应的第二损失,包括:
根据各视频帧的特征向量进行内容类型预测,得到所述样本视频对应的预测类型,所述特征向量包括内容特征向量和关联特征向量中的至少一种;
根据所述预测类型和为所述样本视频标注的标注类型计算得到所述第二损失。
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型还包括第二分类层,所述第二损失包括第一类型损失,所述预测类型包括第一预测类型;
所述根据各视频帧的特征向量进行内容类型预测,得到所述样本视频对应的预测类型,包括:
根据所述各视频帧的内容特征向量计算得到第二特征向量;
通过所述第二分类层根据所述第二特征向量进行内容类型预测,得到所述样本视频对应的第一预测类型;
所述根据所述预测类型和为所述样本视频标注的标注类型计算得到所述第二损失,包括:
根据所述第一预测类型和所述标注类型进行交叉熵计算,得到所述第一类型损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911335651.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可防止芯片重用的RFID标签及方法
- 下一篇:数据处理方法和装置