[发明专利]一种语音转换方法有效
申请号: | 201611267431.X | 申请日: | 2016-12-31 |
公开(公告)号: | CN107068165B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 李燕萍;吕中良;崔立梅 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/51;G10L17/04;G10L25/93 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 转换 方法 | ||
1.一种语音转换方法,其特征在于包括两个部分:训练部分和转换部分,具体如下:
1)、训练部分步骤:
1-1)获取源说话人和目标说话人的平行语料库;
1-2)使用AHOcoder语音分析模型提取语音特征参数和对数基频;
1-3)对步骤1-2)中的语音特征参数进行VTLN和DTW;VTLN为声道长度归一化VocalTract Length Normalization;
1-4)使用EM算法进行SAGMM训练,得到SAGMM参数λ,P(X|λ);SAGMM为自适应高斯混合模型Self-Adaptive Gaussian Mixture Model;
1-5)使用步骤1-4)中的后验条件概率矩阵P(X|λ)进行BLFW+AS训练,得到频率弯折因子α(x,λ)和幅度调节因子s(x,λ),从而构建BLFW+AS转换函数;使用对数基频的均值和方差建立源语音基音频率和目标语音基音频率之间的转换函数;BLFW+AS为双线性频率弯折和幅度调节Bilinear Frequency Warping+Amplitude Scaling;
2)、转换部分步骤:
2-1)输入待转换的源说话人语音;
2-2)使用AHOcoder语音分析模型提取特征参数和对数基频;
2-3)使用SAGMM和训练时得到的参数λ,求取后验条件概率矩阵;
2-4)将频率弯折因子α(x,λ)和幅度调节因子s(x,λ)代入BLFW+AS转换函数,求得转换后的特征参数;
2-5)将对数基频代入训练时得到的基频转换函数得到转换后的对数基频;
2-6)使用AHOdecoder语音合成模型将转换后的特征参数和对数基频合成转换后的语音。
2.根据权利要求1所述的一种语音转换方法,其特征在于,训练部分步骤1-4)中所述的参数λ是根据说话人语音特征参数的具体分布来决定的。
3.根据权利要求1所述的一种语音转换方法,其特征在于,训练部分步骤1-5)中频率弯折因子和幅度调节因子是根据SAGMM训练得到的后验条件概率矩阵来训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611267431.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种霞糕及其制备方法
- 下一篇:硅刚玉耐磨复合砖