[发明专利]一种使用盲语音分离的语音转换系统和方法无效
申请号: | 201210090640.7 | 申请日: | 2012-03-30 |
公开(公告)号: | CN102592607A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 申艳;汶跃龙;张嘉驰;范礼乾;杨柳;蒋诗慧 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/14;G10L11/06;G10L19/04 |
代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 张雪梅 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 语音 分离 转换 系统 方法 | ||
1.一种使用盲语音分离的语音转换方法,其特征在于,该方法包括如下步骤:
1)将采集到的语音信号利用子带分解成低频和高频部分,且分别将低频部分转换得到的语音作为ICA的第一路观测信号x1(t),将高频部分转换得到的语音信号作为ICA的第二路观测信号x2(t);
2)对所述观测信号进行语音分离;
3)对分离出的语音信号提取语音特征参数,获得的源和目标说话人语音的语音特征参数;
4)对所述语音特征参数输入进行语音转换;
5)对进行语音转换后的语音特征参数进行语音合成得到合成语音。
2.根据权利要求1所述的一种使用盲语音分离的语音转换系统和方法,其特征在于,所述步骤2)对所述观测信号进行语音分离包括如下步骤:
201)将所述两路信号x1(t)、x2(t)构成二维观测信号矩阵X(t)=[x1(t),x2(t)]T,作为待分离观测信号;
202)将观测信号X(t)进行分块处理,根据观测信号X(t)的维度合理设置块的大小;
203)对所有分块的观测信号进行处理,得到他们各自的最优分离信号Yi(t),再按观测信号分块过程的逆向变换得到整个观测信号的最优分离信号Y(t);
204)去除信号Y(t)中的背景噪音信号部分,保留Y(t)中期望得到的说话人语音信号,得到语音转换系统需要输入的源或和目标说话人的语音信号。
3.根据权利要求1所述的一种使用盲语音分离的语音转换系统和方法,其特征在于,所述步骤3)对分离出的语音信号提取语音特征参数是分别提取源和目标说话人的语音信号的基音频率和线谱对频率LSF,提取方式如下:
对分离出的语音信号进行不等长的分帧,对分帧后的语音进行倒谱变换,根据倒谱波形中第二个冲激的位置可求得对应的基音频率;对分帧后的语音进行线性预测分析LPC,将分析得到的线性预测系数进行等价变换,得到线谱对频率参数LSF。
4.根据权利要求1所述的一种使用盲语音分离的语音转换系统和方法,其特征在于,所述步骤4)中对所述语音特征参数输入进行语音转换是采用高斯混合模型对源和目标说话人的语音特征参数进行语音转换,得到转换后的目标说话人语音的特征参数。
5.根据权利要求1所述的一种使用盲语音分离的语音转换系统和方法,其特征在于,所述步骤5)中对进行语音转换后的语音特征参数进行语音合成得到合成语音,具体是指采用激励源-声道模型的语音合成器对步骤4中转换后的目标说话人语音的特征参数进行合成,得到转换后的目标说话人语音。
6.一种使用盲语音分离的语音转换系统,其特征在于,该系统包括:
子带分离单元,将采集到的语音信号利用子带分解成低频和高频部分,且分别将低频部分转换得到的语音作为ICA的第一路观测信号x1(t),将高频部分转换得到的语音信号作为ICA的第二路观测信号x2(t);
语音分离单元,对所述观测信号进行语音分离;
特征提取单元,对分离出的语音信号提取语音特征参数,获得的源和目标说话人语音的语音特征参数;
语音转换单元,对所述语音特征参数输入进行语音转换;
语音合成单元,对进行语音转换后的语音特征参数进行语音合成得到合成语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210090640.7/1.html,转载请声明来源钻瓜专利网。