[发明专利]语音合成方法、装置、计算机设备和存储介质有效
申请号: | 202011538151.4 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112634865B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 张坚;张坤雷 | 申请(专利权)人: | 爱驰汽车有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/047 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 唐敏 |
地址: | 334000 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种语音合成方法、装置、计算机设备和存储介质。所述方法包括:获取待处理的中英混合文本;对待处理的中英混合文本进行分段处理,得到中文分段和英文分段;通过向量生成模型得到中文分段的中文语音特征向量,以及英文分段的英文语音特征向量;将中文语音特征向量和英文语音特征向量转换成各自对应的中文语音数据和英文语音数据;融合中文语音数据和英文语音数据,生成中英混合文本的语音数据。本方法通过采用端到端的向量生成模型,可以简化语音合成系统的结构,加快语音合成的效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音合成方法、装置、计算机设备和存储介质。
背景技术
语音合成是通过机械的、电子的方法产生人造语音的技术。它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的语音音频的技术。语音合成技术可以针对单一语种;也可以针对混合语种,例如,中英文。
传统技术中,针对中英文混合的语音合成可以基于由独立的中文模型和英文模型集成的语音合成系统实现。语音合成系统首先通过首先GBK(Chinese Internal CodeSpecification,汉字内码扩展规范)编码将输入的中英混合语句划分成中文、英文语句。然后,对中文、英文语句进行语句分析得到各自对应的语句labels(标注信息)。将中文labels按韵律词进行分段,得到中文分段;英文labels按单词进行分段,得到英文分段。通过中文模型对中文分段进行语音合成;通过英文模型对英文分段进行语音合成。最后,将合成的中英文语音数据存入音频缓冲单元中等待播放。
但是,随着计算机技术的发展,对系统的高效性要求越来越高,因此亟需一种更加高效的语音合成方法。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高对中英混合文本进行语音合成效率的语音合成方法、装置、计算机设备和存储介质。
第一方面,本申请实施例提供一种语音合成方法,所述方法包括:
获取待处理的中英混合文本;
对所述中英混合文本进行分段处理,得到中文分段和英文分段;
通过向量生成模型得到所述中文分段的中文语音特征向量,以及所述英文分段的英文语音特征向量;
将所述中文语音特征向量和所述英文语音特征向量转换成各自对应的中文语音数据和英文语音数据;
融合所述中文语音数据和所述英文语音数据,生成所述中英混合文本的语音数据。
在其中一个实施例中,所述对所述待处理的中英混合文本进行分段处理,得到中文分段和英文分段,包括:
依次对所述中英混合文本中的每个字符进行检测,得到每个字符的字符类别;
根据所述字符类别对所述中英混合文本进行分段处理,得到所述中文分段和所述英文分段。
在其中一个实施例中,所述根据所述字符类别对所述中英混合文本进行分段处理,得到所述中文分段和所述英文分段,包括:
若检测到当前字符的字符类别为中文,则将所述当前字符输出至当前中文分段,并继续对下一个字符进行检测,直至检测到字符类别发生变更,得到所述当前中文分段;
若检测到当前字符的字符类别为英文或空格,则将所述当前字符输出至当前英文分段,并继续对下一个字符进行检测,直至检测到字符类别发生变更,得到所述当前英文分段;
直至所述中英混合文本全部检测完毕,得到所述中文分段和所述英文分段。
在其中一个实施例中,所述融合所述中文语音数据和所述英文语音数据,生成所述中英混合文本的语音数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱驰汽车有限公司,未经爱驰汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011538151.4/2.html,转载请声明来源钻瓜专利网。