[发明专利]基于改进噪声估计的MMSE-LSA语音增强方法有效
申请号: | 202011119852.4 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112201269B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 冯谦 | 申请(专利权)人: | 深圳市车宝信息科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/21;G10L25/45 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 王卓 |
地址: | 518100 广东省深圳市龙岗区平*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 噪声 估计 mmse lsa 语音 增强 方法 | ||
1.基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,包括以下步骤:
S1:对带噪语音进行分帧、加窗处理,再对其做短时傅里叶变换,求出带噪语音的幅度谱和相角;
S2:根据步骤S1的结果,计算出带噪语音的对数能量和谱熵,构建出新的语音特征参数能熵比;
S3:根据步骤S2中的能熵比和语音存在概率的性质,得到能熵比和语音存在概率成正比关系,建立能熵比和语音存在概率的数学关系模型,得到语音存在概率估计值;
S4:对步骤S3中得出的语音存在概率估计值进行平滑,利用平滑后的语音存在概率来更新噪声功率谱估计;
S5:根据步骤S4的结果计算出先验信噪比从而得到谱增益估计,给增益函数添加一个约束阈值;
S6:根据谱估计,并利用MMSE-LSA谱估计器对带噪语音进行语音增强;
在所述步骤S5中,通过给MMSE-LSA谱增益添加一个门限阈值来约束增益取值范围,约束谱增益如下:
式中, 为先验信噪比阈值, 为常数,取0.01,为约束增益值,为第k个频率分量的先验信噪比。
2.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S2中,所述对数能量根据语音段的短时能量大于无语音段可得,具体如下,
若假设经分帧加窗后第i帧的带噪语音信号为,则该帧的短时能量为:
其中, N为帧长,进一步改进能量计算得到对数能量:
式中,α取2.1。
3.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S2中,所述谱熵由下式可得,
设含噪语音信号加窗分帧后的第i帧语音信号为,经傅里叶变换后,设第k个频率分量的功率谱为,则每个频率分量的归一化概率密度函数为:
则每个分析帧的谱熵为:
。
4.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S3中,所述能熵比和语音存在概率的数学关系模型的建立过程如下,
令为能熵比,则其表达式为:
可将能熵比与语音存在概率的关系估计为:
其中, 均为控制参数,语音存在概率的取值范围为0到1之间,在取值相同时,b增大,增大;在信噪比较低时,语音存在的概率密度函数较小,此时b取0.8。
5.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S4中,对估计出的语音存在概率进行递归平滑,其平滑形式如下:
其中,为平滑参数,、分别为当前帧和前一帧的第k个频率分量的语音存在概率估计值。
6.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S5中,采用如下判决引导法估计出先验信噪比,
其中是平滑系数,取0.98,为第k个频率分量的干净语音幅度谱,为后验信噪比,即加入噪声后第k个频谱分量测量的信噪比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市车宝信息科技有限公司,未经深圳市车宝信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011119852.4/1.html,转载请声明来源钻瓜专利网。