[发明专利]语音增强方法、电子设备和存储介质在审

专利信息
申请号: 202211626526.1 申请日: 2022-12-16
公开(公告)号: CN116013343A 公开(公告)日: 2023-04-25
发明(设计)人: 俞凯;江文斌 申请(专利权)人: 思必驰科技股份有限公司
主分类号: G10L21/0208 分类号: G10L21/0208;G10L25/30
代理公司: 北京商专永信知识产权代理事务所(普通合伙) 11400 代理人: 邓婷婷;黄谦
地址: 215123 江苏省苏州市苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 增强 方法 电子设备 存储 介质
【说明书】:

发明公开语音增强方法、电子设备和存储介质,其中,语音增强方法用于语音增强系统,语音增强系统包括编码器模块、双路模块、解码器模块和合并模块,解码器模块包括激励解码器、声道解码器和复数谱解码器,方法包括:利用编码器模块提取原始带噪语音信号中的预设特征;利用双路模块对预设特征在频率轴进行建模处理得到频率轴特征,利用双路模块对预设特征在时间轴进行建模处理得到时间轴特征;利用激励解码器和声道解码器对时间轴特征进行处理得到第一降噪语音信号;利用复数谱解码器对频率轴特征进行处理得到第二降噪语音信号;利用合并模块将第一降噪语音信号、第二降噪语音信号和原始带噪语音信号进行合并得到最终的估计语音信号。

技术领域

本发明属于语音增强技术领域,尤其涉及语音增强方法、电子设备和存储介质。

背景技术

相关技术中,语音增强技术对麦克风收集到的语音信号进行降噪处理,用于提升语音质量和语音可懂度。语音增强作为语音应用系统的前端处理模块,是语音通信、语音识别、说话人识别等系统应用落地的重要技术手段。

语音增强技术已经有数十年的研究历史,主要可以分为传统的基于信号处理的方法,以及近年来基于数据驱动的神经网络方法。传统基于信号处理的方法优点在于无需训练数据、算法适应性强,但其缺点在于降噪效果有限。近年来发展的神经网络降噪方法优点在于闭集测试的降噪效果好,但对于未在训练集出现的噪声类型泛化能力较差。将传统的数字信号处理方法和神经网络方法相结合,能融合两者的优势,得到降噪效果更好、泛化能力更强的语音增强方法。

其中,一种基于数据驱动的神经网络方法首次使用深度神经网络用于语音降噪,其使用全连接层的深度神经网络结构,只对语音信号的幅度谱进行处理,网络的输入为带噪语音信号的幅度谱,输出为纯净语音信号的复倒谱。另一种基于数据驱动的神经网络方法采用时频掩膜估计的神经网络降噪方法,该类方法使用神经网络估计语音信号的某种时频掩膜,比如幅度谱或者功率谱的二值掩膜或比值掩膜,以及复数域的掩膜。语音降噪时,通过该掩膜与带噪语音的幅度谱、功率谱或者复数谱进行点乘即可得到降噪后的语音。除了在时频掩膜上的改进与优化,神经网络降噪方法在神经网络的结构上进行探索。例如,将卷积神经网络和循环神经网络进行组合,得到卷积循环神经网络结构,卷积网络层用于提取信号的时频信息,循环网络层用于建模语音信号的时序信息。或者,对语音信号幅度谱直接进行处理的复数神经网络结构,该网络结构对复数的实部和虚部分别进行处理,并采用复数的运算法则进行前向传播。

另一些神经网络降噪技术由于没有采用傅里叶变换的端到端时域方法,网络的输入和输出均为时域语音信号,使用编码器-解码器的网络结构实现信号特征的提取,在信号的某种特征域上进行降噪处理。此类方法的优势在于能较好地拟合训练数据,但缺点在于泛化能力较差,因而在实际工程应用中较少采用。还有有一些现有技术将传统信号处理的声码器结构和神经网络相结合,得到一种神经网络同态合成的语音增强方法。此类方法能有效地利用语音信号的物理产生模型,从而使得建模方法更为高效、降噪效果更为稳定,但该方法只能对信号的幅度谱进行处理,从而限制了算法的性能上限。

发明人在实现本申请的过程中发现:传统的基于信号处理语音增强方法,不需要训练数据,对未知的噪声有一定适应性,但其依赖噪声的跟踪和估计方法。噪声跟踪和估计算法的准确性决定了降噪算法的性能上限,但传统的噪声估计算法一般只能跟踪和估计稳态噪声,对于非稳态噪声表现较差。另一方面,基于神经网络的语音增强方法,通常未考虑语音信号本身的特点,较依赖大量的训练数据。在闭集测试中能取得较好的降噪效果,但在未知噪声类型上的泛化能力较差,存在过度降噪导致语音失真。

发明内容

本发明实施例提供一种语音增强方法、电子设备和存储介质,用于至少解决上述技术问题之一。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211626526.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top