[发明专利]语音合成方法、装置、设备以及存储介质在审
申请号: | 202110602847.7 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113345417A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 张旭龙;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 设备 以及 存储 介质 | ||
本发明公开了一种语音合成方法,包括:将参考语音序列输入至预设的语音韵律分析模型进行分析,得到语音韵律特征信息;将目标文本序列输入至预设的文本韵律分析模型进行分析,得到文本韵律特征信息;对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理,得到用于记录将要合成的目标语音的韵律的韵律信息;基于所述目标文本序列和所述韵律信息合成所述目标语音。可见,本发明能够在合成语音时将参考语音的语音韵律和目标文本的文本韵律结合以进行语音的合成,使得合成的语音更加逼近人类真实的声音,提高用户体验。本发明还涉及区块链技术领域。
技术领域
本发明涉及语音合成技术领域,尤其涉及一种语音合成方法、装置、计算机设备以及存储介质。
背景技术
随着计算机技术的发展,语音合成技术已经发展成为一项成熟的技术,其被广泛地应用于实际的生活中,如,智能客服、手机语音助手、地图导航等。但是,随之而来的是用户对语音合成技术的期待也越来越高。目前,用户主要关注合成的语音是否足够贴合人类真实的声音,听起来是否足够自然逼真。传统的语音合成技术主要关注的方向是如何将文本序列转换成语音序列,较少的关注转换后的语音序列的韵律是否合适。由于缺少了对合成语音的韵律的把控,所以传统的语音合成技术合成的语音往往不能很好地贴合人类真实的声音,真实的听感较差。
近年,为了提高工业产品的用户体验,业界和学术界对合成语音的韵律问题的关注度也越来越高。对于合成语音的韵律问题,目前较为普遍的解决方法是通过人工神经网络模型来提取将要合成的语音中的韵律信息,然后基于韵律信息合成语音,从而使得合成的语音具有一定的韵律,能够一定程度上贴合人类真实的声音。然而,通过人工神经网络模型来提取将要合成的语音中的韵律信息是一项复杂的任务,将人工神经网络技术应用在语音的韵律信息的提取中仍有许多改进和优化的空间。可见,目前的语音合成技术合成的语音与人类真实声音的拟合程度较低,用户体验较差。
发明内容
本发明所要解决的技术问题在于,目前的语音合成技术合成的语音与人类真实声音的拟合程度较低,用户体验较差。
为了解决上述技术问题,本发明第一方面公开了一种语音合成方法,所述方法包括:
将参考语音序列输入至预设的语音韵律分析模型进行分析,得到语音韵律特征信息;
将目标文本序列输入至预设的文本韵律分析模型进行分析,得到文本韵律特征信息;
对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理,得到用于记录将要合成的目标语音的韵律的韵律信息;
基于所述目标文本序列和所述韵律信息合成所述目标语音。
本发明第二方面公开了一种语音合成装置,所述装置包括:
语音韵律分析模块,用于将参考语音序列输入至预设的语音韵律分析模型进行分析,得到语音韵律特征信息;
文本韵律分析模块,用于将目标文本序列输入至预设的文本韵律分析模型进行分析,得到文本韵律特征信息;
合并处理模块,用于对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理,得到用于记录将要合成的目标语音的韵律的韵律信息;
语音合成模块,用于基于所述目标文本序列和所述韵律信息合成所述目标语音。
本发明第三方面公开了一种计算机设备,所述计算机设备包括:
存储有可执行程序代码的存储器;
与所述存储器连接的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的语音合成方法中的部分或全部步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110602847.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种导线去皮装置、方法和PCB线路板焊接设备
- 下一篇:销毁装置