[发明专利]一种视频配音方法、装置及终端设备有效
申请号: | 201810231485.3 | 申请日: | 2018-03-20 |
公开(公告)号: | CN110312161B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 康辉;吕华 | 申请(专利权)人: | TCL科技集团股份有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/435;H04N21/8547;H04N21/4402 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李艳丽 |
地址: | 516006 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 配音 方法 装置 终端设备 | ||
本发明提供了一种视频配音方法、装置及终端设备,包括:提取视频数据中的音频数据,得到音频片段并获取所述音频片段的时间戳;将所述音频片段转换为文本信息,并将所述文本信息与剧本中的角色对白进行匹配,获取所述文本信息对应的角色对白文本、所述角色对白文本所属的角色和所述角色的情感属性;根据所述音频片段对应的角色对白文本、角色对白文本所属的角色和角色的情感属性,合成配音数据并在所述配音数据中写入所述音频片段的时间戳;按照时间顺序将所有所述配音数据与所述视频数据进行合成。结合角色的情感属性自动进行配音,无需再通过后期进行人工配音,有效地解决了现有的视频配音存在效率低且成本高的问题。
技术领域
本发明属于视频编辑技术领域,尤其涉及一种视频配音方法、装置及终端设备。
背景技术
演员在现场拍摄录制时所讲的台词对白由于拍摄现场存在众多噪音和杂音,没有办法达到视频播放的要求,需要通过降噪优化的方式,优化现场视频语音效,然而现场语音降噪优化处理也无法达到完全无杂音的配音效果。因此,通常是通过后期进行人工配音,再将录制的配音与视频进行合成。然而后期人工配音工作量大、效率低且成本高。
综上所述,现有的视频配音存在效率低且成本高的问题。
发明内容
有鉴于此,本发明实施例提供了一种视频配音方法、装置及终端设备,以解决现有的视频配音存在效率低且成本高的问题。
本发明实施例的第一方面提供了视频配音方法,所述视频配音方法,包括:
提取视频数据中的音频数据,得到音频片段并获取所述音频片段的时间戳;
将所述音频片段转换为文本信息,并将所述文本信息与剧本中的角色对白进行匹配,获取所述文本信息对应的角色对白文本、所述角色对白文本所属的角色和所述角色的情感属性;
根据所述音频片段对应的角色对白文本、角色对白文本所属的角色和角色的情感属性,合成配音数据并在所述配音数据中写入所述音频片段的时间戳;
根据所述音频片段的时间戳将所述配音数据与所述视频数据进行合成。
本发明实施例的第二方面提供了一种视频配音装置,所述视频配音装置,包括:
提取模块,用于提取视频数据中的音频数据,得到音频片段并获取所述音频片段的时间戳;
匹配模块,用于将所述音频片段转换为文本信息,并将所述文本信息与剧本中的角色对白进行匹配,获取所述文本信息对应的角色对白文本、所述角色对白文本所属的角色和所述角色的情感属性;
配音合成模块,用于根据所述音频片段对应的角色对白文本、角色对白文本所属的角色和角色的情感属性,合成配音数据并在所述配音数据中写入所述音频片段的时间戳;
视频合成模块,用于根据所述音频片段的时间戳将所述配音数据与所述视频数据进行合成。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
提取视频数据中的音频数据,得到音频片段并获取所述音频片段的时间戳;
将所述音频片段转换为文本信息,并将所述文本信息与剧本中的角色对白进行匹配,获取所述文本信息对应的角色对白文本、所述角色对白文本所属的角色和所述角色的情感属性;
根据所述音频片段对应的角色对白文本、角色对白文本所属的角色和角色的情感属性,合成配音数据并在所述配音数据中写入所述音频片段的时间戳;
根据所述音频片段的时间戳将所述配音数据与所述视频数据进行合成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL科技集团股份有限公司,未经TCL科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810231485.3/2.html,转载请声明来源钻瓜专利网。