[发明专利]音频合成方法、装置、设备、计算机可读存储介质及产品在审

专利信息
申请号: 202210738357.4 申请日: 2022-06-27
公开(公告)号: CN115132168A 公开(公告)日: 2022-09-30
发明(设计)人: 李可;芦效春;徐露;邹招林 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G10L13/027 分类号: G10L13/027;G10L13/04;G10L25/30
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 王军振;刘芳
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 合成 方法 装置 设备 计算机 可读 存储 介质 产品
【说明书】:

本公开提供一种音频合成方法、装置、设备、计算机可读存储介质及产品,可用于人工智能领域或其他领域,方法包括:获取待处理的客服语谱图;将所述客服语谱图输入至预设的生成对抗网络中的目标生成器内,获得所述目标生成器输出的具有客户预设的个性化特征的目标语谱图;通过预设的语音合成工具,根据所述目标语谱图生成具有客户预设的个性化特征的目标音频。从而能够保证生成的目标音频能够满足用户的个性化需求,此外,能够提高生成的目标音频的真实性,进而能够提升用户后续对该目标音频的使用体验。

技术领域

本公开涉及人工智能领域,尤其涉及一种音频合成方法、装置、设备、计算机可读存储介质及产品。

背景技术

现有的客服语音合成技术多为Text-to-Speech(TTS)技术,是指从文字转换为语音的技术,通过该技术可以让机器人开口说话。

TTS技术主要包括两个部分:语音合成前端与语音合成后端。语音合成前端主要作用是将合成文本进行预处理并转化为发音的符号化描述,具体对于中文来说,是将合成文本进行预处理并转化为含有韵律信息的音素序列。主要包含文本正则化、正则文本转因素以及韵律层预测等模块。语音合成后端则是将前端输出的发音符号化描述转化为语音波形。

但是,采用上述方法合成的语音往往音质不高、韵律平淡且合成效果不稳定。进而会导致根据上述合成语音生成的客服语音会影响用户的使用体验。

发明内容

本公开提供一种音频合成方法、装置、设备、计算机可读存储介质及产品,用于解决现有的音频合成方法合成的语音效果不佳,导致用户体验较差的技术问题。

本公开的第一个方面是提供一种音频合成方法,包括:

获取待处理的客服语谱图;

将所述客服语谱图输入至预设的生成对抗网络中的目标生成器内,获得所述目标生成器输出的具有客户预设的个性化特征的目标语谱图;

通过预设的语音合成工具,根据所述目标语谱图生成具有客户预设的个性化特征的目标音频。

本公开的第二个方面是提供一种音频合成装置,包括:

获取模块,用于获取待处理的客服语谱图;

处理模块,用于将所述客服语谱图输入至预设的生成对抗网络中的目标生成器内,获得所述目标生成器输出的具有客户预设的个性化特征的目标语谱图;

生成模块,用于通过预设的语音合成工具,根据所述目标语谱图生成具有客户预设的个性化特征的目标音频。

本公开的第三个方面是提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

所述存储器存储计算机执行指令;

所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的方法。

本公开的第四个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

本公开的第五个方面是提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。

本公开提供的音频合成方法、装置、设备、计算机可读存储介质及产品,可以预先训练获得生成对抗网络,其中,该生成对抗网络中的目标生成器能够根据语谱图生成具有用户个性化特征的目标语谱图。从而在获取到待处理的客服语谱图之后,可以将该客服语谱图输入至该目标生成器中,获得具有客户预设的个性化特征的目标语谱图,基于该目标语谱图进行目标音频的生成,从而能够保证生成的目标音频能够满足用户的个性化需求,此外,能够提高生成的目标音频的真实性,进而能够提升用户后续对该目标音频的使用体验。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210738357.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top