[发明专利]视频处理方法和装置、电子设备及计算机可读存储介质有效
申请号: | 201910345625.4 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110087143B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 赵红亮;李凯 | 申请(专利权)人: | 北京谦仁科技有限公司 |
主分类号: | H04N21/845 | 分类号: | H04N21/845;H04N21/4788;H04N21/4402;H04N5/265;G10L15/26;G06K9/00 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋;刘熔 |
地址: | 100007 北京市东城区安*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请实施例公开了一种视频处理方法和装置、电子设备及计算机可读存储介质。本申请实施例通过获取至少一个第一用户的第一视频文件和第二用户的第二视频文件,根据至少一个窗口时长对第一视频文件和第二视频文件进行遍历截取获得第一视频候选集,根据第一视频文件的单位时间周期中表征视频内用户的状态的第一向量和第二向量来获取表征其概率分布值的第四向量,并根据第四向量从第一视频候选集中选取多个第一视频片段和对应的第二视频片段,进而合成目标视频片段。由此,能够提取优质或精彩视频片段以充分体现第一用户与第二用户之间的交互,由此,提供了更加丰富的用户体验。
技术领域
本发明涉及视频处理技术领域,具体涉及一种视频处理方法和装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术和教育信息化的高速发展,移动多媒体教学平台的应用也越来越广泛。现有技术中,精彩视频的提取主要是通过对样本进行训练生成模型,再使用该模型对教学视频进行处理,由此,无法保证很好地捕捉到老师与学生之间的互动的精彩瞬间。如果人工方式提取,则工作量巨大,几乎不可能完成。由此,导致无法精确地提取老师与学生之间的互动的精彩视频片段,并进一步导致用户体验差。
发明内容
有鉴于此,本发明实施例提供一种视频处理方法和装置、电子设备及计算机可读存储介质,能够基于第一用户与第二用户之间的交互提取优质或精彩视频片段,并进一步提供更加丰富的用户体验。
根据本发明实施例的第一方面,提供一种视频处理方法,包括:
获取第一用户的至少一个第一视频文件和第二用户的至少一个第二视频文件;
根据至少一个窗口时长对所述第一视频文件和所述第二视频文件进行遍历截取以获得第一视频候选集,所述第一视频候选集包括多个视频片段对,各所述视频片段对包括窗口时长相同且时间轴位置相同的第一视频片段和对应的第二视频片段;
根据所述的第一视频文件获取每个单位时间周期对应的第一向量,根据所述第二视频文件获取每个单位时间周期对应的第二向量,所述第一向量用于表征对应的单位时间周期内的第一用户状态,所述第二向量用于表征对应的单位时间周期内的第二用户状态;
根据每个单位时间周期对应的所述第一向量和所述第二向量获取每个单位时间周期的第三向量;
根据每个视频片段对对应的时间轴位置和所述第三向量,确定第四向量;
根据所述第四向量从所述第一视频候选集中选取多个第一视频片段和第二视频片段;
根据选取的第一视频片段和第二视频片段获取目标视频片段。
优选地,根据所述的第一视频文件获取每个单位时间周期对应的第一向量包括:
根据第一视频文件确定目标单位时间周期对应的视频数据和音频数据;
分别对所述视频数据的多个图像帧进行人脸识别,获取每个图像帧对应的人脸状态参数;
对所述音频数据进行语音识别,获取语音分布参数;
根据所述人脸状态参数和所述语音分布参数确定所述第一向量。
优选地,根据所述第二视频文件获取每个单位时间周期对应的第二向量包括:
根据第二视频文件确定目标单位时间周期对应的视频数据和音频数据;
分别对所述视频数据的多个图像帧进行人脸识别,得到每个图像帧对应的人脸状态参数;
对所述音频数据进行语音识别,获取语音分布参数;
根据所述人脸状态参数和所述语音分布参数获取所述第二向量。
优选地,所述人脸状态参数包括表征人脸出现情况的第一值和表征人脸表情状态的第二值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京谦仁科技有限公司,未经北京谦仁科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910345625.4/2.html,转载请声明来源钻瓜专利网。