[发明专利]一种提升语音听感的降噪方法在审
申请号: | 202011497927.2 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112750451A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 关海欣;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L19/03 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提升 语音 方法 | ||
1.一种提升语音听感的降噪方法,其特征在于,包括:
S100获取带噪语音信号,对带噪语音信号进行预处理得到所述带噪语音信号频域X(n,k)特征;
S200通过提取所述带噪语音信号频域X(n,k)特征,结合深度学习网络得到预估的干净语音谱Snn;
S300通过预估的干净语音谱Snn和听觉掩蔽模型计算Bark域掩蔽阈值Tbark得到扩展频谱T;
S400通过扩展频谱T计算最终的估计谱S;
S500将所述估计谱S恢复出语音输出信号。
2.根据权利要求1所述的降噪方法,其特征在于,
所述预处理包括对所述带噪语音信号进行分帧加窗处理得到训练语音数据。
3.根据权利要求2所述的降噪方法,其特征在于,
所述预处理还包括对所述训练语音数据进行傅里叶变换转换到语音帧频域X(n,k),其中n、k分别为时、频坐标。
4.根据权利要求2所述的降噪方法,其特征在于,
所述分帧加窗处理采用汉明窗。
5.根据权利要求1所述的降噪方法,其特征在于,
所述干净语音谱Snn通过提取所述语音帧频域X(n,k)特征,以及深度学习网络计算获得该帧各频点增益GainNN(n,k),进而获得。
6.根据权利要求1所述的降噪方法,其特征在于,
所述扩展频谱T基于预估的干净语音谱Snn和听觉掩蔽模型计算Bark域掩蔽阈值Tbark,并通过扩展函数扩展得到。
7.根据权利要求1所述的降噪方法,其特征在于,
通过扩展频谱T计算最终增益的参数α和参数β,从而得到最终的估计谱S。
8.根据权利要求1-7任一项所述的降噪方法,其特征在于,
所述语音输出信号基于估计谱S进行傅里叶反变换及重叠相加法将得出。
9.一种存储介质,其特征在于,
所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-8任一项所述的提升语音听感的降噪方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011497927.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种误识别抑制方法
- 下一篇:一种数据传输方法、装置、终端设备和存储介质