[发明专利]语音增强方法及装置在审

申请号：	202310573048.0	申请日：	2023-05-17
公开（公告）号：	CN116386653A	公开（公告）日：	2023-07-04
发明（设计）人：	鲁叶欣;艾杨;凌震华	申请（专利权）人：	中国科学技术大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0264;G10L25/03
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	陈颖
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音增强方法及装置，通过获取带噪语音波形的带噪相位谱及带噪幅度谱，利用预设的语音增强模型处理带噪相位谱及带噪幅度谱，得到增强相位谱及增强幅度谱，根据增强相位谱及增强幅度谱计算得到增强语音波形，语音增强模型被配置为基于带噪相位谱及带噪幅度谱预测增强伪实部谱及增强伪虚部谱，预测增强幅度谱，基于预设的模拟相位计算公式对增强伪实部谱及增强伪虚部谱进行计算，得到值域区间限制在主值区间内的增强相位谱的内部状态表示，避免了由于相位的卷绕特性导致无法预测得到增强相位谱的问题，使得根据增强相位谱及增强幅度谱计算得到的增强语音波形质量高、信噪比高，极大地改善了对带噪语音波形的增强效果。

技术领域

本申请涉及语音处理技术领域，更具体地说，涉及一种语音增强方法及装置。

背景技术

在现实生活场景中，被设备捕捉到的语音总是不可避免地被噪音所干扰，这极大地影响了通讯、助听等设备的实际应用，所以需要对语音进行增强，语音增强旨在从被噪音干扰的语音波形中恢复出干净语音波形。

随着深度学习技术的发展，通常通过训练语音增强模型，利用训练完成的语音增强模型对带噪的语音波形进行增强，得到增强的语音波形。现有的语音增强模型通常对带噪的语音波形的带噪的幅度谱进行增强，然后基于增强的幅度谱和带噪的相位谱计算出增强的语音波形，但由于是基于带噪的相位谱计算出的增强的语音波形，缺少对相位谱的增强，使得计算出的增强的语音波形的质量差、信噪比低，对带噪语音波形的增强效果差。

发明内容

有鉴于此，本申请提供了一种语音增强方法及装置，用于解决现有语音增强方式，由于缺少对相位谱的增强，使得计算出的增强的语音波形的质量差、信噪比低，对带噪语音波形的增强效果差的问题。

为了实现上述目的，现提出的方案如下：

一种语音增强方法，包括：

获取带噪语音波形的带噪相位谱及带噪幅度谱；

利用预设的语音增强模型处理所述带噪相位谱及所述带噪幅度谱，得到所述带噪相位谱对应的增强相位谱及所述带噪幅度谱对应的增强幅度谱；

所述语音增强模型被配置为，基于输入的所述带噪相位谱及所述带噪幅度谱预测所述带噪相位谱对应的增强伪实部谱及增强伪虚部谱，以及，预测所述带噪幅度谱对应的增强幅度谱，并基于预设的模拟相位计算公式对所述增强伪实部谱及所述增强伪虚部谱进行计算，得到值域区间限制在主值区间内的增强相位谱的内部状态表示；

根据所述增强相位谱及所述增强幅度谱计算得到所述带噪语音波形对应的增强语音波形。

优选地，所述获取带噪语音波形的带噪相位谱及带噪幅度谱之后，还包括：

对所述带噪幅度谱进行幅度压缩，得到压缩后带噪幅度谱；

所述利用预设的语音增强模型处理所述带噪相位谱及所述带噪幅度谱，得到所述带噪幅度谱对应的增强幅度谱的过程，包括：

将所述带噪相位谱及所述压缩后带噪幅度谱输入预设的语音增强模型，以利用所述语音增强模型预测得到所述压缩后带噪幅度谱对应的压缩增强幅度谱掩膜，并将所述压缩增强幅度谱掩膜逐点乘以所述压缩后带噪幅度谱，得到压缩增强幅度谱，对所述压缩增强幅度谱进行解压缩得到所述带噪幅度谱对应的增强幅度谱。