[发明专利]统计参数模型建立方法和装置、语音合成方法和装置有效
申请号: | 201710258873.6 | 申请日: | 2017-04-19 |
公开(公告)号: | CN106971709B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 李为;严航宇;李科;吴永坚;黄飞跃 | 申请(专利权)人: | 腾讯科技(上海)有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 201200 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 统计 参数 模型 建立 方法 装置 语音 合成 | ||
1.一种统计参数模型建立方法,所述方法包括:
获取模型训练数据,所述模型训练数据包括文本特征序列和对应的原始语音样本序列;
将所述文本特征样本序列中的文本特征样本点与原始语音样本序列中的语音样本点匹配形成的原始向量矩阵输入统计参数模型训练;
将所述原始向量矩阵在隐层中进行非线性映射计算,输出对应的预测语音样本点;其中,所述统计参数模型中包括不同数目的隐层,当前隐层输出的隐层节点序列输入到当前隐层的下一隐层中进行非线性映射计算,直至在输出层得到原始向量矩阵对应的预测语音样本点;
根据所述预测语音样本点与对应的原始语音样本点采用差距最小原则确定所述统计参数模型的模型参数,得到对应的目标统计参数模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述向量矩阵在隐层中进行非线性映射计算,输出对应的预测语音样本点的步骤,包括:
根据原始向量矩阵得到输入层节点序列,将输入层节点序列进行非线性映射得到第一隐层对应的隐层节点序列,将第一隐层作为当前处理隐层;
获取所述当前处理隐层对应的当前隐层节点序列,根据当前处理隐层采样间隔对所述当前隐层节点序列进行采样和非线性映射得到下一层隐层节点序列,将所述当前处理隐层的下一层隐层作为当前处理隐层,重复进入所述获取所述当前处理隐层对应的当前隐层节点序列的步骤,直到处理隐层数到达最大隐层数得到第一预测语音样本点,其中当前处理隐层的下一层隐层采样间隔为当前处理隐层采样间隔的倍数。
3.根据权利要求2所述的方法,其特征在于,所述根据当前处理隐层采样间隔对所述当前隐层节点序列进行采样和非线性映射得到下一层隐层节点序列的步骤,包括:
将所述当前隐层节点序列进行采样后进行第一线性卷积运算得到第一处理结果;
获取非线性映射函数集合,将第一处理结果分别采用所述非线性映射函数集合中的非线性映射函数进行非线性映射得到非线性映射结果集合;
将所述非线性映射结果集合中的各个非线性映射结果相加,再进行第二线性卷积运算得到下一层隐层节点序列。
4.根据权利要求3所述的方法,其特征在于,所述获取非线性映射函数集合,将第一处理结果分别采用所述非线性映射函数集合中的非线性映射函数进行非线性映射得到非线性映射结果集合的步骤,包括:
获取非线性映射函数集合,将第一处理结果分别采用所述非线性映射函数集合中tanh函数和sigmoid函数进行非线性映射得到非线性映射结果集合。
5.根据权利要求2所述的方法,其特征在于,所述根据原始向量矩阵得到输入层节点序列,将输入层节点序列进行非线性映射得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层的步骤,包括:
获取补充文本特征样本点和对应的补充语音样本点,匹配加入所述原始向量矩阵得到补充向量矩阵,根据所述补充向量矩阵得到输入层节点序列,将输入层节点序列进行非线性映射得到第一隐层对应的隐层节点序列,将所述第一隐层作为当前处理隐层;进入所述获取所述当前处理隐层对应的当前隐层节点序列的步骤,得到第二预测语音样本点;
所述根据所述预测语音样本点与对应的原始语音样本点差距最小原则确定所述统计参数模型的模型参数,得到对应的目标统计参数模型的步骤包括:
根据所述第一预测语音样本点与对应的第一原始语音样本点、第二预测语音样本点与对应的第二原始语音样本点采用差距最小原则确定所述统计参数模型的模型参数,得到对应的目标统计参数模型。
6.一种语音合成方法,所述方法包括:
获取待转换文本信息;
对所述待转换文本信息进行处理得到对应的文本特征序列;
获取初始化语音样本点与所述文本特征序列中的部分文本特征样本点匹配形成初始化向量矩阵;
将所述初始化向量矩阵输入上述权利要求1-5中任意一项所述目标统计参数模型中,得到所述文本特征序列对应的预测语音样本点序列;
根据所述预测语音样本点序列输出所述待转换文本信息对应的合成语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(上海)有限公司,未经腾讯科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710258873.6/1.html,转载请声明来源钻瓜专利网。