[发明专利]视频播放方法、装置、电子设备及存储介质在审
申请号: | 202210521140.8 | 申请日: | 2022-05-13 |
公开(公告)号: | CN115037982A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 马秋红;彭飞;邓竹立 | 申请(专利权)人: | 北京五八信息技术有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/435;H04N21/458;H04N21/462 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 杨柳苑 |
地址: | 100083 北京市海淀区学清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 播放 方法 装置 电子设备 存储 介质 | ||
1.一种视频播放方法,其特征在于,包括:
播放目标视频;所述目标视频具有对应的模态数据,所述模态数据包括视频帧数据、音频数据和字幕数据;
响应针对所述目标视频的视频播放的请求;
根据所述请求确定第一关键词;
将所述第一关键词、所述模态数据输入视频处理模型中,生成所述第一关键词对应的目标视频片段;其中,所述视频处理模型经过样本视频对应的模态数据训练得到;
播放所述目标视频片段。
2.根据权利要求1所述的方法,其特征在于,所述根据所述请求确定第一关键词,包括:
确定所述请求对应的文字信息;所述请求至少包括文本、语音以及图片;
对所述文字信息进行语义识别,确定第一关键词。
3.根据权利要求1所述的方法,其特征在于,在所述播放目标视频之前,还包括:
获取关键词训练集和样本视频对应的模态数据训练集;其中,所述关键词训练集包括若干第二关键词和所述第二关键词对应的视频片段;
将所述第二关键词和所述模态数据训练集中的模态数据输入待训练的视频处理模型,得到预测结果;
基于所述预测结果和所述第二关键词对应的视频片段,训练所述待训练的视频处理模型,以得到训练好的视频处理模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述预测结果和所述第二关键词对应的视频片段,训练所述待训练的视频处理模型,包括:
根据所述预测结果和第二关键词对应的视频片段,利用预设损失函数计算出损失函数值;所述损失函数值用于指示所述预测结果与所述第二关键词对应的视频片段的差异;
基于所述损失函数值,调整所述待训练的视频处理模型的模型参数。
5.根据权利要求3所述的方法,其特征在于,所述视频处理模型包括特征提取模块、特征融合模块和任务决策模块,所述特征提取模块连接所述特征融合模块,所述特征融合模块连接所述任务决策模块;
所述将所述第二关键词和所述模态数据训练集中的模态数据输入待训练的视频处理模型,得到预测结果,包括:
通过所述特征提取模块对所述第二关键词和所述模态数据进行特征提取,得到第二关键词特征向量和所述模态数据对应的特征向量;
通过所述特征融合模块将所述第二关键词特征向量和所述模态数据对应的特征向量进行融合,得到融合特征;
通过所述任务决策模块根据所述融合特征得到预测结果。
6.根据权利要求3所述的方法,其特征在于,所述获取关键词训练集和样本视频对应的模态数据训练集,包括:
获取样本视频;
提取所述样本视频中的视频帧数据作为视频帧训练集、提取所述样本视频中的音频数据作为音频训练集、以及提取所述样本视频中的字幕数据作为字幕训练集;
基于所述取样本视频对应的视频帧数据、音频数据和字幕数据,生成第二关键词作为关键词训练集。
7.根据权利要求3所述的方法,其特征在于,所述第一关键词和所述第二关键词至少包括角色名称、主演名称、剧情情节、经典台词、配乐名称中的一种或多种组合。
8.一种视频播放装置,其特征在于,包括:
第一视频播放模块,用于播放目标视频;所述目标视频具有对应的模态数据,所述模态数据包括视频帧数据、音频数据和字幕数据;
请求响应模块,用于响应针对所述目标视频的视频播放的请求;
关键词确定模块,用于根据所述请求确定第一关键词;
视频生成模块,用于将所述第一关键词、所述模态数据输入视频处理模型中,生成所述第一关键词对应的目标视频片段;其中,所述视频处理模型经过样本视频对应的模态数据训练得到;
第二视频播放模块,用于播放所述目标视频片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京五八信息技术有限公司,未经北京五八信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210521140.8/1.html,转载请声明来源钻瓜专利网。