[发明专利]一种双传感器语音增强方法及实现装置有效
申请号: | 201910678398.7 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110390945B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 张军;李学;宁更新;冯义志;余华;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0264;G10L25/60;G10L25/06;G10L25/21;G10L25/24 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 传感器 语音 增强 方法 实现 装置 | ||
1.一种基于双通道维纳滤波的双传感器语音增强方法,其特征在于,所述的双传感器语音增强方法包括以下步骤:
S1、同步采集干净的气导训练语音和非气导训练语音,建立气导语音帧和非气导语音帧的双通道语音联合分类模型,并计算对应于上述双通道语音联合分类模型中每个分类的气导语音功率谱均值Φss(ω,l)、非气导语音功率谱均值Φbb(ω,l)、气导语音和非气导语音之间的互谱均值Φbs(ω,l),其中ω为频率,l为分类的序号;
S2、同步采集气导测试语音和非气导测试语音,利用气导测试语音的纯噪声段建立气导噪声的统计模型,并计算气导噪声的功率谱均值Φvv(ω);
S3、利用气导噪声的统计模型和步骤S1中的双通道语音联合分类模型对同步输入的气导测试语音帧和非气导测试语音帧进行分类;
S4、根据步骤S3的分类结果和功率谱均值Φvv(ω)构建双通道维纳滤波器,对气导测试语音帧和非气导测试语音帧进行滤波,得到增强后的气导语音。
2.根据权利要求1所述的双传感器语音增强方法,其特征在于,所述的步骤S1过程如下:
S1.1、对同步采集的干净的气导训练语音和非气导训练语音进行分帧和预处理,提取每帧语音的特征参数,其中,所述的特征参数为倒梅尔谱系数;
S1.2、利用步骤S1.1中得到的干净的气导语音和非气导语音特征,训练双通道语音联合分类模型;
S1.3、使用经过训练的双通道语音联合分类模型对所有气导训练语音帧和非气导语音帧进行分类,然后计算每一分类所包含的气导训练语音帧和非气导语音帧的气导语音功率谱均值Φss(ω,l)、非气导语音功率谱均值Φbb(ω,l)、气导语音和非气导语音之间的互谱均值Φbs(ω,l)。
3.根据权利要求2所述的双传感器语音增强方法,其特征在于,所述的步骤S1.2中,双通道语音联合分类模型采用多数据流GMM,其中,GMM为高斯混合模型,即
其中N(o,μ,σ)为高斯函数,ox(k)和ob(k)为第k帧气导测试语音和非气导测试语音中提取的特征矢量,和为多数据流GMM中气导语音数据流和非气导语音数据流第l个高斯分量的均值,和为多数据流GMM中气导语音数据流和非气导语音数据流第l个高斯分量的方差,cl为多数据流GMM中第l个高斯分量的权重,wx和wb分别为多数据流GMM中气导语音数据流和非气导语音数据流的权重,L为高斯分量的个数。
4.根据权利要求3所述的双传感器语音增强方法,其特征在于,所述的步骤S1.3中,双通道语音联合分类模型中的每个高斯分量代表一个分类,对于每一对同步的气导训练语音帧和非气导语音帧,采用下式计算其对每一个分类的得分
其中,当前的气导训练语音帧和非气导语音帧属于得分最高的分类;计算出所有气导训练语音帧和非气导语音帧所属的分类,然后计算同一分类所包含的气导训练语音帧和非气导语音帧的气导语音功率谱均值Φss(ω,l)、非气导语音功率谱均值Φbb(ω,l)、气导语音和非气导语音之间的互谱均值Φbs(ω,l)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910678398.7/1.html,转载请声明来源钻瓜专利网。