[发明专利]一种非平行文本条件下的语音转换方法有效

申请号：	201010520107.0	申请日：	2010-10-27
公开（公告）号：	CN102063899A	公开（公告）日：	2011-05-18
发明（设计）人：	李燕萍;张玲华	申请（专利权）人：	南京邮电大学
主分类号：	G10L13/08	分类号：	G10L13/08;G10L15/06
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	许方
地址：	210003 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种平行文本条件下语音转换方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种非平行文本条件下的语音转换方法，其特征在于，包括训练阶段和转换阶段，其中所述训练阶段包括如下步骤：

步骤A，语音信号预处理步骤：分别对输入语音信号依次进行预加重、分帧和加窗处理，所述输入语音信号分别包括目标说话人、源说话人、参考目标说话人的语音信号；

步骤B，元音帧提取步骤：根据频域能量分布特征，分别判定经步骤A预处理后的目标说话人、源说话人、参考目标说话人的语音信号中元音的位置，分别提取目标说话人、源说话人、参考目标说话人的语音信号中的元音帧；

步骤C，元音帧的音素分类，对步骤B提取到的目标说话人、源说话人、参考目标说话人的元音帧，根据汉语元音映射表分别进行音素分类；

步骤D，元音帧的语音特征提取：基于谐波加噪声模型对分类后的元音帧分别进行分解，分别求取目标说话人、源说话人、参考目标说话人的元音帧中的谐波成分和噪声成分，然后对谐波加噪声模型的参数进一步降维，提取元音帧中线性谱频率参数，最终分别得到目标说话人、源说话人、参考目标说话人的元音帧的特征矢量，所述特征矢量包括频谱特征和韵律特征；

步骤E，对于步骤D提取到的源说话人的元音帧的特征矢量，训练HMM音素分类模型；

步骤F，对于频谱特征矢量，建立频谱特征转换模型：

F1，对步骤D所述源说话人的频谱特征和参考目标说话人的频谱特征分别建立高斯混合模型，分别以各自高斯混合模型的均值矢量构成超矢量，然后对所有超矢量进行主成分分析，提取基矢量和偏移量，从而建立主成分语音模型；

F2，模型自适应：采用步骤D所述目标说话人的频谱特征对步骤F1得到的主成分语音模型进行模型自适应，得到源说话人与目标说话人的频谱特征转换模型；

步骤G，对步骤D得到的源说话人和目标说话人的韵律特征采用单高斯建模，得到各自的均值和方差；

所述转换阶段包括如下步骤：

步骤H，输入源说话人新的语音信号，对源说话人输入的新的语音信号依次进行上述步骤A-步骤D所述的操作，得到源说话人新的语音信号中元音帧的特征矢量，采用上述步骤E得到的HMM音素分类模型进行音素分类；

步骤I，采用步骤F2得到的源说话人与目标说话人的频谱特征转换模型进行语音频谱转换，得到转换后的目标说话人的频谱特征；

步骤J，对于步骤H中得到的源说话人的韵律特征，采用步骤G得到的单高斯模型进行韵律转换，得到转换后的目标说话人的韵律特征；

步骤K，对步骤F将转换后的频谱特征和韵律特征经过谐波加噪声模型进行合成，最终得到转换后的语音。

2.根据权利要求1所述的非平行文本条件下的语音转换方法，其特征在于，所述步骤A的预处理步骤中，所述预加重处理的预加重系数为0.96，分帧处理按20ms分帧，帧交叠为35%，所述加窗处理采用汉明窗进行加窗处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010520107.0/1.html，转载请声明来源钻瓜专利网。

上一篇：具有离散电子排斥元件阵列的光电检测器阵列
下一篇：蓄电池能量数字化主动维护管理系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种非平行文本条件下的语音转换方法有效

专利文献下载