[发明专利]一种视频配音方法、装置、电子设备和存储介质在审
申请号: | 202110525262.X | 申请日: | 2021-05-10 |
公开(公告)号: | CN113421577A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 童子晟;郑乃光 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;H04N5/76 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 配音 方法 装置 电子设备 存储 介质 | ||
本公开关于一种视频配音方法、装置、电子设备和存储介质,所述方法包括:显示录音页面,录音页面包括录音操作信息和目标视频,响应于基于录音操作信息触发的录音启动指令,录制语音信息。在语音信息的录制过程中,播放目标视频并同步对获取的语音信息进行降噪处理。响应于基于所述录音操作信息触发的录音结束指令,显示包括降噪后的目标语音信息的语音信息展示页面。该方法可以在录制语音的同时对语音进行降噪处理,得到目标语音信息,可以在录音结束后得到具有降噪效果的语音信息,使得录音场景与降噪场景连贯,提高了语音处理效率,从而提高了用户体验。该方法还可以在录音结束后对目标语音信息进行调整,增加了用户选择的多样性。
技术领域
本公开涉及互联网技术领域,尤其涉及一种视频配音方法、装置、电子设备和存储介质。
背景技术
随着互联网技术的发展,可以进行语音交互的应用程序也成了人们日常生活不可或缺的一部分,而在语音社交、视频剪辑配音等应用语音交互的场景中,若周围环境噪音较大,则需要对语音信息进行降噪处理。
相关技术中,在对语音信息进行降噪处理时,需要先完成语音输入,再进行降噪处理,录音场景和降噪场景之间较为割裂,缺少场景下的连贯交互操作,从而降低了语音交互的效率,降低了用户体验。
发明内容
本公开提供一种视频配音方法、装置、电子设备和存储介质,以至少解决相关技术中录音场景和降噪场景不连贯,语音交互效率低,用户体验低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频配音方法,所述方法包括:
显示录音页面,所述录音页面包括录音操作信息和目标视频;
响应于基于所述录音操作信息触发的录音启动指令,录制语音信息;
在所述语音信息的录制过程中,播放所述目标视频,并对所述语音信息进行降噪处理;
响应于基于所述录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面,所述目标语音信息为降噪处理后的语音信息,所述目标语音信息根据所述目标视频对应的显示时间轴上的时间填充所述目标视频对应的音频轨道。
作为一个可选的实施例,所述录音页面还包括处于第一状态的降噪操作信息,所述处于第一状态的降噪操作信息指示降噪功能关闭,所述方法还包括:
响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,将所述录音页面中的降噪操作信息由第一状态更新为第二状态;
所述处于第二状态的降噪操作信息指示降噪功能开启。
作为一个可选的实施例,所述方法还包括:
响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,获取语音降噪模型;
所述在所述语音信息的录制过程中,对所述语音信息进行降噪处理包括:
在所述语音信息的录制过程中,基于所述语音降噪模型,对所述语音信息进行降噪处理。
作为一个可选的实施例,所述获取语音降噪模型包括:
在所述降噪启动指令为预设时间段内的非首次启动指令的情况下,从缓存中获取所述语音降噪模型。
作为一个可选的实施例,所述获取语音降噪模型包括:
在所述降噪启动指令为预设时间段内的首次启动指令的情况下,从服务器中获取所述语音降噪模型。
作为一个可选的实施例,所述方法还包括:
在所述录音页面中显示所述语音降噪模型的获取进度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110525262.X/2.html,转载请声明来源钻瓜专利网。