[发明专利]语音合成方法、装置、计算机设备和存储介质有效

申请号：	202011538151.4	申请日：	2020-12-23
公开（公告）号：	CN112634865B	公开（公告）日：	2022-10-28
发明（设计）人：	张坚;张坤雷	申请（专利权）人：	爱驰汽车有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/047
代理公司：	华进联合专利商标代理有限公司 44224	代理人：	唐敏
地址：	334000 江西***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音合成方法、装置、计算机设备和存储介质。所述方法包括：获取待处理的中英混合文本；对待处理的中英混合文本进行分段处理，得到中文分段和英文分段；通过向量生成模型得到中文分段的中文语音特征向量，以及英文分段的英文语音特征向量；将中文语音特征向量和英文语音特征向量转换成各自对应的中文语音数据和英文语音数据；融合中文语音数据和英文语音数据，生成中英混合文本的语音数据。本方法通过采用端到端的向量生成模型，可以简化语音合成系统的结构，加快语音合成的效率。

技术领域

本申请涉及计算机技术领域，特别是涉及一种语音合成方法、装置、计算机设备和存储介质。

背景技术

语音合成是通过机械的、电子的方法产生人造语音的技术。它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的语音音频的技术。语音合成技术可以针对单一语种；也可以针对混合语种，例如，中英文。

传统技术中，针对中英文混合的语音合成可以基于由独立的中文模型和英文模型集成的语音合成系统实现。语音合成系统首先通过首先GBK（Chinese Internal CodeSpecification，汉字内码扩展规范）编码将输入的中英混合语句划分成中文、英文语句。然后，对中文、英文语句进行语句分析得到各自对应的语句labels（标注信息）。将中文labels按韵律词进行分段，得到中文分段；英文labels按单词进行分段，得到英文分段。通过中文模型对中文分段进行语音合成；通过英文模型对英文分段进行语音合成。最后，将合成的中英文语音数据存入音频缓冲单元中等待播放。

但是，随着计算机技术的发展，对系统的高效性要求越来越高，因此亟需一种更加高效的语音合成方法。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高对中英混合文本进行语音合成效率的语音合成方法、装置、计算机设备和存储介质。

第一方面，本申请实施例提供一种语音合成方法，所述方法包括：

获取待处理的中英混合文本；

对所述中英混合文本进行分段处理，得到中文分段和英文分段；

通过向量生成模型得到所述中文分段的中文语音特征向量，以及所述英文分段的英文语音特征向量；

将所述中文语音特征向量和所述英文语音特征向量转换成各自对应的中文语音数据和英文语音数据；

融合所述中文语音数据和所述英文语音数据，生成所述中英混合文本的语音数据。

在其中一个实施例中，所述对所述待处理的中英混合文本进行分段处理，得到中文分段和英文分段，包括：

依次对所述中英混合文本中的每个字符进行检测，得到每个字符的字符类别；

根据所述字符类别对所述中英混合文本进行分段处理，得到所述中文分段和所述英文分段。