[发明专利]视频摘要的生成方法、设备和存储介质在审
申请号: | 202110697549.0 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113438509A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 洪国伟;林静旭 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44;H04N21/8549;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 摘要 生成 方法 设备 存储 介质 | ||
1.一种视频摘要的生成方法,其特征在于,所述方法包括:
提取目标视频中每一视频帧的视觉特征;
将所述每一视频帧的视觉特征输入至自注意力网络,以使所述自注意力网络依据所述视频帧之间的相对位置获得所述每一视频帧的自注意力特征;
基于所述每一视频帧的自注意力特征,确定所述每一视频帧的重要性预测值;
基于所述每一视频帧的重要性预测值,生成所述目标视频的视频摘要。
2.根据权利要求1所述的方法,其特征在于,所述自注意力网络包括前向的自注意力网络和后向的自注意力网络;
所述将所述每一视频帧的视觉特征输入至自注意力网络,以使所述自注意力网络依据所述视频帧之间的相对位置获得所述每一视频帧的自注意力特征,包括:
将所述每一视频帧的视觉特征输入所述前向的自注意力网络,获得所述每一视频帧的第一自注意力特征,并将所述每一视频帧的视觉特征输入所述后向的自注意力网络,获得所述每一视频帧的第二自注意力特征;
将所述每一视频帧的第一自注意力特征和所述每一视频帧的第二自注意力特征对应叠加,获得所述每一视频帧的自注意力特征。
3.根据权利要求2所述的方法,其特征在于,所述前向的自注意力网络利用公式得到所述每一视频帧的第一自注意力特征;
所述后向的自注意力网络利用公式得到所述每一视频帧的第二自注意力特征;
其中,n为所述目标视频中视频帧的数目,i、j为1至n中的任一数值,xi为第i视频帧的视觉特征,xj为第j视频帧的视觉特征,ci1为所述第i视频帧的第一自注意力特征,aij1为所述前向的自注意力网络中的权重系数,αijV1为在所述前向的自注意力网络中所述第i视频帧与所述第j视频帧之间的相对位置,WV1为所述前向的自注意力网络的线性变换参数;ci2为所述第i视频帧的第二自注意力特征,aij2为所述后向的自注意力网络中的权重系数,αijV2为在所述后向的自注意力网络中所述第i视频帧与所述第j视频帧之间的相对位置,WV2为所述后向的自注意力网络的线性变换参数。
4.根据权利要求3所述的方法,其特征在于,aij1是基于前向掩码计算获得,aij2是基于后向掩码计算获得。
5.根据权利要求1所述的方法,其特征在于,所述基于所述每一视频帧的重要性预测值,生成所述目标视频的视频摘要,包括:
将所述目标视频划分为多个镜头片段;
基于所述镜头片段中各个所述视频帧的重要性预测值,确定所述镜头片段的重要度;
基于每个所述镜头片段的重要度,生成所述目标视频的视频摘要。
6.根据权利要求5所述的方法,其特征在于,所述基于每个所述镜头片段的重要度,生成所述目标视频的视频摘要,包括:
在所述多个镜头片段中选取至少一个目标镜头片段,所述至少一个目标镜头片段的长度总和为视频摘要的预设目标长度且所述至少一个目标镜头片段的重要度之和为最大值;
按照所述至少一个目标镜头片段在所述目标视频中的位置信息,将所述至少一个目标镜头片段拼接为所述目标视频的视频摘要。
7.根据权利要求5或6所述的方法,其特征在于,所述基于所述镜头片段中各个所述视频帧的重要性预测值,确定所述镜头片段的重要度,包括:
计算所述镜头片段中各个所述视频帧的重要性预测值的平均值;
将所述镜头片段对应的平均值,确定为所述镜头片段的重要度。
8.根据权利要求6所述的方法,其特征在于,所述预设目标长度为所述目标视频的长度和预设比值的乘积,所述预设比值小于1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110697549.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体工艺腔室和半导体工艺设备
- 下一篇:半导体结构及其制作方法