[发明专利]一种基于皮尔逊相关系数的频域滤波语音降噪方法在审
申请号: | 202210110180.3 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114495964A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 于姣龙;张青松;杜琳;孙婷;白俊梅;马美娜;王陈春 | 申请(专利权)人: | 西安烽火电子科技有限责任公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L21/0264 |
代理公司: | 西安睿通知识产权代理事务所(特殊普通合伙) 61218 | 代理人: | 寇兰英 |
地址: | 710119 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 皮尔逊 相关系数 滤波 语音 方法 | ||
1.一种基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,包括以下步骤:
步骤1,对带噪语音信号进行短时傅里叶变换STFT处理,得到频域带噪语音信号;
步骤2,利用步骤1得到的频域带噪语音信号进行带噪语音信号的自相关矩阵估计、加性噪声信号的自相关矩阵估计和期望信号的自相关矩阵估计,然后将带噪语音信号的自相关矩阵估计结果和期望信号的自相关矩阵估计结果代入最优降噪滤波器的公式,得到最优降噪滤波器;
所述最优降噪滤波器是基于皮尔逊相关系数的幅度平方MSPCC函数最大和基于失真的均方误差最小求解所得;
步骤3,用步骤2计算得到的最优降噪滤波器对步骤1的频域带噪语音信号进行滤波处理,输出频域语音降噪信号;
步骤4,对频域降噪语音信号进行反短时傅里叶变换,输出时域语音降噪信号。
2.如权利要求1所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,步骤2中自相关矩阵估计的子步骤为:
(1)初始化子步骤:初始输入的语音信号只有纯噪声没有期望信号,即期望信号的自相关矩阵Φx(k,n)=0;采用短时平均估计出语音信号的自相关矩阵和加性噪声信号的自相关矩阵,即初始化yH(k,n);
其中,y(k(n)是连续时间帧长度为L的带噪语音频域信号,k代表频点,k∈{0,1,2,...,K-1},n代表时间帧,n∈{0,1,2,...,N},N为自然数,上标H表示矩阵共轭转置,运算符*表示两个矩阵相乘;
(2)更新子步骤:利用遗忘因子更新带噪语音信号的自相关矩阵Φy(k,n)=αyΦy(k,n-1)+(1-αy)y(k,n)*yH(k,n),其中αy为带噪语音信号更新遗忘因子;
采用语音端点检测VAD检测带噪语音信号中的无语音信号段,在无语音信号段更新加性噪声信号的自相关矩阵:
Φv(k,n)=αvΦv(k,n-1)+(1-αv)y(k,n)*yH(k,n),其中αv为加性噪声信号更新遗忘因子,在有语音信号段不更新加性噪声的自相关矩阵;
其中,y(k,n)是连续时间帧长度为L的带噪语音频域信号,k代表频点,k∈{0,1,2,...,K-1},n代表时间帧,n∈{0,1,2,...,N},N为自然数,上标H表示矩阵共轭转置,运算符*表示两个矩阵相乘;
(3)更新的期望信号的自相关矩阵估计子步骤,更新的期望信号的自相关矩阵估计的结果为:
Φx(k,n)=Φy(k,n)-Φv(k,n),
其中,Φy(k,n)为更新的带噪语音信号的自相关矩阵,Φv(k,n)为无语音信号段更新的加性噪声信号的自相关矩阵。
3.如权利要求2所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,在初始化子步骤中,所述N为自然数,且N=40。
4.如权利要求2所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,在更新子步骤中,所述带噪语音信号更新遗忘因子αy=0.95。
5.如权利要求2所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,在更新子步骤中,所述加性噪声信号更新遗忘因子αv=0.65。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火电子科技有限责任公司,未经西安烽火电子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210110180.3/1.html,转载请声明来源钻瓜专利网。