[发明专利]一种语音合成方法及装置在审
申请号: | 201810834892.3 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109036377A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 何树民;徐文韬;陈玉玲 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L25/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发声 音素信息 文本信息 音素序列 语音特征向量 声母 韵母 语音合成 音调 排序 计算机技术领域 神经网络训练 扩展性 播放装置 输入语音 音素 真实性 方言 样本 语种 语音 播放 中文 | ||
本发明提供一种语音合成方法及装置,涉及计算机技术领域,方法包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。由于考虑了中文发声的声母、韵母以及音调的关系,模拟出的声音具有更高的真实性,且可以适用于由音素构成的各种方言以及其它语种,具有很高的扩展性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音合成方法及装置。
背景技术
语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。
目前现有技术中的语音合成技术有:方法一,基于规则合成的语音合成技术。这种合成方式通过语音学规则来产生目标语音。规则合成系统存储的是较小的语音单位(如音素、双音素、半音节或音节)的声学参数,以及由音素组成音节,再由音节组成词或句子的各种规则。方法二,基于波形拼接的语音合成技术。这种合成方式以语句、短语、词或音节为合成单元,这些单元被分别录音后直接进行数字编码,经适当的数据压缩,组成一个合成语音库,重放时,根据待输出的信息,在语料库中取出相应单元的波形数据,串接或编辑在一起,经解码还原出语音。方法三,基于参数分析合成的语音合成技术。这种合成方式多以音节、半音节或音素为合成单元。
但是方法一的方法,需要设定非常繁琐的规则,而且需要分析不同的环境和不同的上下文来设置不同的规则。同时合成的语音自然度不高,无法被广泛的应用。方法二以及方法三的方法,需要有足够的高质量发音人录音才能够合成高质量的语音,所使用的语音库文件太大,而且多音节字根本无法解决。无法通过从公开场合获取的声音进行合成。
综上所述,现有技术中不能提供一种规则简单、语音自然度高的语音合成方法。
发明内容
本发明提供一种语音合成方法及装置,用于解决现有技术中不能提供一种规则简单、语音自然度高的语音合成方法的问题。
本发明实施例提供一种语音合成方法,包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;
将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。
本发明实施例中,将待发声的文本信息按照文本信息中文字的声母、韵母、以及音调的排列方式。将待发声的文本信息转换为音素序列,并将音素序列输入到语音发声模型中,得到进行发声的语音特征向量,在本发明实施例中,由于考虑了中文发声的声母、韵母以及音调的关系,模拟出的声音具有更高的真实性,且可以适用于由音素构成的各种方言以及其它语种,具有很高的扩展性。
进一步地,所述将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,包括:
将语音参数和所述音素序列输入所述语音发声模型,所述语音参数用于指示发声者的标识;所述语音发声模型是对各发声者的发声样本进行神经网络训练得到;
通过所述语音发声模型,确定所述文本信息对应的所述发声者的语音特征向量。
本发明实施例中,将语音参数输入到语音发声模型中,得到的语音特征向量为语音参数对应的发声者的声音对应的语音内容,用发声者的声音进行发音。在本发明实施例中,可以用语音发声模型中训练过的任意发声者的声音进行播报。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810834892.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种闽南语语音合成方法
- 下一篇:家电语音识别测试方法、装置、系统及存储介质