[发明专利]基于文本的音频/视频重录方法和系统在审

专利信息
申请号: 202110984882.X 申请日: 2021-08-26
公开(公告)号: CN113438434A 公开(公告)日: 2021-09-24
发明(设计)人: 周昌印;余飞;金伟成;韩晔 申请(专利权)人: 视见科技(杭州)有限公司
主分类号: H04N5/76 分类号: H04N5/76;H04N5/232;G06N3/04;G10L15/26
代理公司: 北京市柳沈律师事务所 11105 代理人: 巫资青
地址: 310000 浙江省杭州市余杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文本 音频 视频 方法 系统
【权利要求书】:

1.一种基于文本的视频重拍方法,所述方法包括:

对已拍摄的初始视频进行语音识别,并将语音识别结果与视频时间轴上的时间点进行匹配;

在需要重拍部分视频之时,启动控制状态;

基于匹配结果,确定需要重拍的视频所对应的开始文本内容和结束文本内容;

退出控制状态,根据所选择的开始文本内容和结束文本内容重新拍摄对应的视频;以及

将初始视频中的未重拍部分与重新拍摄的视频自动合成为一个视频,或者将初始视频的除重新拍摄的视频所对应的音频部分以外的所有内容与重新拍摄的视频所对应的音频自动合成为一个视频。

2.如权利要求1所述的方法,其中,所述方法还包括:用户在正式重新开始拍摄视频之前经历一缓冲期,在该缓冲期期间,所述开始文本内容所对应的视频时间点的拍摄画面被显示,并且用户基于所显示的所述开始文本内容所对应的视频时间点的拍摄画面来调整拍摄姿态。

3.如权利要求1所述的方法,其中,所述方法还包括:使用深度神经网络将之前录制的画面与重新拍摄的画面之间插入将两者融合的画面;或者

其中所述方法还包括:在所述自动合成之前,对初始视频和重新拍摄的视频中各自被合成的部分的时间长度进行轻微调整。

4.如权利要求1所述的方法,其中,所拍摄的视频内容以流媒体的形式进行保存。

5.一种基于文本的音频重录方法,所述方法包括:

对已录制的初始音频进行语音识别,并将语音识别结果与音频时间轴上的时间点进行匹配;

在需要重录部分音频之时,启动控制状态;

基于匹配结果,确定需要重录的音频所对应的开始文本内容和结束文本内容;

退出控制状态,根据所选择的开始文本内容和结束文本内容重新录制对应的音频;以及

将初始音频中的未重录部分与重新录制的音频自动合成为一个音频。

6.如权利要求1或5所述的方法,其中,启动控制状态和退出控制状态通过以下中的一者或多者来实现:用户界面输入,远程控件输入,语音输入,或者特定姿势或运动输入。

7.如权利要求1或5所述的方法,其中,所述结束文本内容默认设置为已拍摄的内容所对应的最后的台本内容。

8.如权利要求1或5所述的方法,其中所述开始文本内容和结束文本内容包括通过对UI项进行操作来确定,所述UI项基于经语音/文字匹配引擎匹配得到的结果的文本内容以及经语音/文字匹配引擎处理得到的语音中的停顿中的一者或两者来显示。

9.如权利要求1或5所述的方法,其中所述方法还包括在启动控制状态后,调整录制的参数。

10.一种基于文本的视频重拍系统,包括:

语音识别(ASR)模块,其被配置为对已拍摄的初始视频进行语音识别;

语音/文字匹配引擎,其被配置为基于对于视频的语音识别结果将语音识别结果与视频时间轴上的时间点进行匹配;

重录控制模块,在需要重拍视频之时,启动控制状态,接受对需要重拍的视频所对应的开始文本内容和结束文本内容的选择,并在完成视频重拍后退出控制状态;

音视频编码录制模块,其被配置为基于所选择的重新拍摄的开始文本内容和结束文本内容重新拍摄视频,并将初始视频中的未重拍部分与重新拍摄的视频自动合成为一个视频,或者将初始视频的除重新拍摄的音频部分以外的所有内容与重新拍摄的音频自动合成为一个视频;以及

用户界面,其被配置为显示原始视频,显示语音/文字匹配引擎的文字与视频的匹配结果,以及显示重新拍摄的视频。

11.如权利要求10所述的系统,其中,用户在正式重新开始拍摄视频之前经历一缓冲期,在该缓冲期期间,用户界面显示所述开始文本内容所对应的视频时间点的拍摄画面,并且用户基于所显示的所述开始文本内容所对应的视频时间点的拍摄画面来调整拍摄姿态。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视见科技(杭州)有限公司,未经视见科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110984882.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top