[发明专利]基于非负低秩和稀疏矩阵分解原理的语音增强方法有效
申请号: | 201310548773.9 | 申请日: | 2013-11-07 |
公开(公告)号: | CN103559888A | 公开(公告)日: | 2014-02-05 |
发明(设计)人: | 孙成立;须明;王希敏;谢坚筱 | 申请(专利权)人: | 航空电子系统综合技术重点实验室 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0272 |
代理公司: | 南昌市平凡知识产权代理事务所 36122 | 代理人: | 欧阳沁 |
地址: | 200233 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 非负低秩 稀疏 矩阵 分解 原理 语音 增强 方法 | ||
1.基于非负低秩和稀疏矩阵分解原理的语音增强方法,其特征在于,用非负低秩和稀疏矩阵分解方法从含噪语音中分离出语音信号,其实现步骤如下:
(1)对离散含噪语音信号进行预处理,预处理包括信号平滑和分帧;
(2)将分帧后的含噪语音信号进行离散傅里叶变换,得到含噪语音频谱;
(3)在频域中,将每帧语音的频谱幅度作为列向量,按时间顺序排列,由若干个语音帧构成含噪语音时频矩阵;
(4)利用非负低秩和稀疏矩阵分解算法对含噪语音时频矩阵进行分解,获得非负的低秩矩阵和稀疏矩阵;分解表达式为:
Y=L+S+E满足rank(L)≤r,||S||0≤h,L≥0,S≥0;
其中:Y为含噪语音时频矩阵;L为低秩矩阵,对应噪声的幅度谱;S为稀疏矩阵,对应语音的幅度谱,||S||0表示稀疏矩阵S含有的非0元素个数,rank(L)表示矩阵L的秩,E为残差矩阵,r和h表示低秩和稀疏约束上限参数;
(5)利用稀疏矩阵S和含噪语音的相位谱重构增强语音频谱,然后通过逆傅里叶变换,得到时域形式的增强语音。
2.根据权利要求1所述的基于非负低秩和稀疏矩阵分解原理的语音增强方法,其特征在于,所述步骤(1)中对离散含噪语音信号进行预处理的处理过程为:
(1)采用P点最近邻信号均值来进行信号平滑,用以平滑含噪语音的幅度波形;
(2)对含噪语音信号分帧,分帧采用的窗函数为Hamming窗,窗长为200点,每次帧间移动的重叠点数为80点。
3.根据权利要求1所述的非负低秩和稀疏矩阵分解算法,其特征在于,计算低秩矩阵L和稀疏矩阵S的步骤如下:
(1)初始化:Y0=Y;L0=S0=[0]N×K;
迭代次数初值i=1;最大迭代次数imax=103;相对误差阈值δ=10-3;
(2)使用NMF更新低秩矩阵:(W,H)=NMF(Yi-1),Li=WH;W∈RN×r,H∈Rr×K;
NMF表示非负矩阵分解,NMF表示非负矩阵分解,W和H是秩为r的NMF分解结果,NMF的测度函数选择Itakura-Saito测度;
(3)使用软门限算子更新稀疏矩阵:Si=(Yi-1-Li+Si-1>λ)□(Yi-1-Li+Si-1-λ);
其中:符号表示矩阵对应位置元素乘积,λ为门限常数;λ与噪声水平有关,推荐值λ=σ,其中σ为噪声的均方差;
(4)更新叠加矩阵:Yi=Li+Si;
(5)如果i达到最大迭代次数i=imax或者停止迭代,输出L和S的估计值Li和Si;否则跳转到步骤(2),i=i+1;继续执行迭代过程。
4.根据权利要求1所述的基于非负低秩和稀疏矩阵分解原理的语音增强方法,其特征在于,所述步骤(5)中利用稀疏矩阵和含噪语音的相位谱重构增强语音频谱:
其中:∠Y(n,k)为含噪语音的频谱相位,S为稀疏矩阵,|S(n,k)|为稀疏矩阵谱幅度值,为重构的增强语音频谱,n为时间帧索引,k为频率索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航空电子系统综合技术重点实验室,未经航空电子系统综合技术重点实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310548773.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蛋氨酸的生产方法
- 下一篇:一种方便、即食型甜酒的加工方法