[发明专利]音频降噪方法和装置、存储介质及电子装置在审
申请号: | 202211625879.X | 申请日: | 2022-12-16 |
公开(公告)号: | CN116110418A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 黄景标;方瑞东;林聚财;黄威震;毛亚朋;刘克柱;薛晗;殷俊;王国龙 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0232;G10L21/0264;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 装置 存储 介质 电子 | ||
本发明实施例提供了一种音频降噪方法和装置、存储介质及电子装置,该方法包括:获取当前时刻的第一带噪音频数据和历史时刻的第二带噪音频数据;依据所述第一带噪音频数据和所述第二带噪音频数据进行特征提取,得到目标特征信息;将所述目标特征信息输入到目标神经网络结构中,得到所述第一带噪音频数据对应的目标音频信号。通过本发明,解决了相关技术中通过纯净音频信号对降噪模型进行训练,导致降噪模型的降噪的准确度比较低的问题。
技术领域
本发明实施例涉及音频降噪技术领域,具体而言,涉及一种音频降噪方法和装置、存储介质及电子装置。
背景技术
在现实生活中,当人们使用手机开启免提电话或是视频会议终端进行视频会议时,由于环境的随机性,设备在采集到目标人声的同时还会采集到环境的各种噪声,而这些噪声会严重影响人们对目标人声的获取,因此需要采用音频降噪对环境的各种噪声进行抑制,一般来说,噪声分为稳态噪声和非稳态噪声,对于稳态噪声,目前有许多经典的降噪算法可以对其进行降噪处理,如维纳滤波等,而对于非稳态噪声,经典的降噪算法无法对其进行处理,而随着神经网络的兴起,凭借神经网络强大的非线性拟合能力,非稳态噪声可以通过该方案进行有效的去除;但是现有技术中的神经网络都是使用理想情况下的语音数据作为纯净数据进行训练,使得神经网络的音频降噪效果比较差。
针对相关技术中通过纯净音频信号对降噪模型进行训练,导致降噪模型的降噪的准确度比较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种音频降噪方法和装置、存储介质及电子装置,以至少解决相关技术中通过纯净音频信号对降噪模型进行训练,导致降噪模型的降噪的准确度比较低的问题。
根据本发明的一个实施例,提供了一种音频降噪方法,包括:获取当前时刻的第一带噪音频数据和历史时刻的第二带噪音频数据;依据所述第一带噪音频数据和所述第二带噪音频数据进行特征提取,得到目标特征信息;将所述目标特征信息输入到目标神经网络结构中,得到所述第一带噪音频数据对应的目标音频信号,其中,所述目标神经网络结构由带噪音频训练样本集训练得到的,所述带噪音频训练样本集由多个带噪音频训练样本和每个带噪音频训练样本对应的预设音频信号组成,每个带噪音频训练样本通过所述预设音频信号和目标噪声信号得到。
在一个示例性实施例中,所述目标神经网络结构由编码模块、时序传递模块、跨层连接模块和解码模块组成,其中,所述跨层连接模块用于连接所述编码模块中的卷积层和所述解码模块中的转置卷积层,所述跨层连接模块中的卷积核由所述编码模块输出的数据的层数决定。
在一个示例性实施例中,依据所述第一带噪音频数据和所述第二带噪音频数据进行特征提取,得到目标特征信息包括:对所述第一带噪音频数据中的每帧信号进行短时傅里叶变换,得到所述第一带噪音频数据对应的第一时频域信息;对所述第二带噪音频数据中的每帧信号进行短时傅里叶变换,得到所述第二带噪音频数据对应的第二时频域信息;对所述第一时频域信息和所述第二时频域信息进行拼接处理,得到所述目标特征信息。
在一个示例性实施例中,将所述目标特征信息输入到目标神经网络结构中,得到所述第一带噪音频数据对应的目标音频信号包括:通过所述编码模块对所述目标特征信息进行编码处理,得到目标特征矩阵;通过所述时序传递模块将所述目标特征矩阵传递到所述解码模块中;通过所述跨层连接模块将所述编码模块中的每个卷积层的输出特征矩阵传递到所述解码模块的每个转置卷积层中;通过所述解码模块对所述目标特征矩阵和所述输出特征矩阵进行解码处理,得到所述第一带噪音频数据对应的目标音频信号。
在一个示例性实施例中,所述目标神经网络结构采用以下步骤训练得到:获取所述带噪音频训练样本集;对所述带噪音频训练样本集中的带噪音频训练样本进行特征提取,得到训练特征集;依据所述训练特征集对初始目标神经网络结构进行训练,得到所述目标神经网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211625879.X/2.html,转载请声明来源钻瓜专利网。