[发明专利]基于GMM噪声估计的语音增强方法在审

申请号：	201410704574.7	申请日：	2014-11-26
公开（公告）号：	CN104464728A	公开（公告）日：	2015-03-25
发明（设计）人：	吕勇	申请（专利权）人：	河海大学
主分类号：	G10L15/20	分类号：	G10L15/20;G10L21/0216
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	李玉平
地址：	211100 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于高斯混合模型(GMM：Gaussian Mixture Model)噪声估计的语音增强方法，用GMM估计背景噪声和谱减系数，对含噪语音进行谱减，恢复纯净语音。首先，含噪语音经过预处理得到含噪语音的幅度和相位，幅度用于噪声估计和谱减，相位用于恢复时域信号；然后利用GMM从含噪语音中实时估计噪声参数和纯净语音倒谱特征，并根据估得的纯净语音倒谱特征计算谱减系数；最后，对含噪语音的频谱进行谱减，恢复时域信号，并用重叠相加法得到增强后的语音。本发明可以显著提高语音增强算法对非平稳噪声的跟踪能力。
搜索关键词：	基于 gmm 噪声估计语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于GMM噪声估计的语音增强方法，其特征是用GMM从含噪语音中实时估计噪声参数和纯净语音特征参数，并根据估得的纯净语音特征参数计算谱减系数，对含噪语音的频谱进行谱减，恢复时域信号，得到增强后的语音；具体包括：(1)利用一个含有多个高斯单元的GMM描述纯净语音特征向量的分布，在训练阶段用纯净训练语音的特征向量训练生成该GMM；(2)用于谱减的噪声均值通过GMM从含噪语音特征向量中实时估计，在噪声估计中，不区分语音帧和非语音帧，而是逐帧更新噪声的均值；(3)在噪声参数估计中，除估计噪声均值外，还估计噪声的方差；(4)利用估得的噪声均值和方差对GMM的均值和方差进行变换，使之与当前环境相匹配，并用最小均方误差算法估计纯净语音特征向量；(5)将估得的纯净语音特征向量变换到线性谱域，计算人耳的掩蔽阈值，得到每个离散数字频率处的掩蔽阈值，并根据掩蔽阈值计算谱减系数；(6)根据估得的噪声均值和谱减系数，对语音帧的含噪语音频谱进行幅度谱减，得到增强后的语音幅度谱，对非语音帧的噪声幅度谱乘以一个较小的噪声保留系数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河海大学，未经河海大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410704574.7/，转载请声明来源钻瓜专利网。

上一篇：应用于数据记录设备的插拔装置
下一篇：液晶显示装置的时脉产生电路及其操作方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于GMM噪声估计的语音增强方法在审

专利文献下载