[发明专利]语音合成方法、装置、设备以及存储介质在审

申请号：	202110602847.7	申请日：	2021-05-31
公开（公告）号：	CN113345417A	公开（公告）日：	2021-09-03
发明（设计）人：	张旭龙;王健宗	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L13/10	分类号：	G10L13/10
代理公司：	深圳国新南方知识产权代理有限公司 44374	代理人：	周雷
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音合成方法，包括：将参考语音序列输入至预设的语音韵律分析模型进行分析，得到语音韵律特征信息；将目标文本序列输入至预设的文本韵律分析模型进行分析，得到文本韵律特征信息；对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理，得到用于记录将要合成的目标语音的韵律的韵律信息；基于所述目标文本序列和所述韵律信息合成所述目标语音。可见，本发明能够在合成语音时将参考语音的语音韵律和目标文本的文本韵律结合以进行语音的合成，使得合成的语音更加逼近人类真实的声音，提高用户体验。本发明还涉及区块链技术领域。

技术领域

本发明涉及语音合成技术领域，尤其涉及一种语音合成方法、装置、计算机设备以及存储介质。

背景技术

随着计算机技术的发展，语音合成技术已经发展成为一项成熟的技术，其被广泛地应用于实际的生活中，如，智能客服、手机语音助手、地图导航等。但是，随之而来的是用户对语音合成技术的期待也越来越高。目前，用户主要关注合成的语音是否足够贴合人类真实的声音，听起来是否足够自然逼真。传统的语音合成技术主要关注的方向是如何将文本序列转换成语音序列，较少的关注转换后的语音序列的韵律是否合适。由于缺少了对合成语音的韵律的把控，所以传统的语音合成技术合成的语音往往不能很好地贴合人类真实的声音，真实的听感较差。

近年，为了提高工业产品的用户体验，业界和学术界对合成语音的韵律问题的关注度也越来越高。对于合成语音的韵律问题，目前较为普遍的解决方法是通过人工神经网络模型来提取将要合成的语音中的韵律信息，然后基于韵律信息合成语音，从而使得合成的语音具有一定的韵律，能够一定程度上贴合人类真实的声音。然而，通过人工神经网络模型来提取将要合成的语音中的韵律信息是一项复杂的任务，将人工神经网络技术应用在语音的韵律信息的提取中仍有许多改进和优化的空间。可见，目前的语音合成技术合成的语音与人类真实声音的拟合程度较低，用户体验较差。

发明内容

本发明所要解决的技术问题在于，目前的语音合成技术合成的语音与人类真实声音的拟合程度较低，用户体验较差。

为了解决上述技术问题，本发明第一方面公开了一种语音合成方法，所述方法包括：

将参考语音序列输入至预设的语音韵律分析模型进行分析，得到语音韵律特征信息；

将目标文本序列输入至预设的文本韵律分析模型进行分析，得到文本韵律特征信息；

对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理，得到用于记录将要合成的目标语音的韵律的韵律信息；

基于所述目标文本序列和所述韵律信息合成所述目标语音。

本发明第二方面公开了一种语音合成装置，所述装置包括：

语音韵律分析模块，用于将参考语音序列输入至预设的语音韵律分析模型进行分析，得到语音韵律特征信息；

文本韵律分析模块，用于将目标文本序列输入至预设的文本韵律分析模型进行分析，得到文本韵律特征信息；

合并处理模块，用于对所述语音韵律特征信息和所述文本韵律特征信息进行预设的合并处理，得到用于记录将要合成的目标语音的韵律的韵律信息；

语音合成模块，用于基于所述目标文本序列和所述韵律信息合成所述目标语音。