[发明专利]一种语音合成方法及装置在审
申请号: | 201810834892.3 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109036377A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 何树民;徐文韬;陈玉玲 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L25/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种语音合成方法及装置,涉及计算机技术领域,方法包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。由于考虑了中文发声的声母、韵母以及音调的关系,模拟出的声音具有更高的真实性,且可以适用于由音素构成的各种方言以及其它语种,具有很高的扩展性。 | ||
搜索关键词: | 发声 音素信息 文本信息 音素序列 语音特征向量 声母 韵母 语音合成 音调 排序 计算机技术领域 神经网络训练 扩展性 播放装置 输入语音 音素 真实性 方言 样本 语种 语音 播放 中文 | ||
【主权项】:
1.一种语音合成方法,其特征在于,所述方法包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810834892.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种闽南语语音合成方法
- 下一篇:家电语音识别测试方法、装置、系统及存储介质