[发明专利]基于神经网络的降噪方法、系统、电子设备及存储介质在审
申请号: | 202110915899.X | 申请日: | 2021-08-10 |
公开(公告)号: | CN113838471A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 张德明 | 申请(专利权)人: | 北京塞宾科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30;G10L25/24;G10L25/03;G06N3/04;G06N3/08 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 李传亮 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 方法 系统 电子设备 存储 介质 | ||
本申请涉及一种基于神经网络的降噪方法、系统、电子设备及存储介质,所述降噪方法包括:构建神经网络并训练;对音频信号进行语音特征提取,并将提取得到的语音特征作为输入信号输入训练好的神经网络中,得到不同频带的增益系数;将所述增益系数作用于频域信号,并对所述频域信号进行逆傅里叶变换,得到降噪后的语音信号。本申请具有可以在低功耗平台上运行,也就是说,既可以用于上行降噪,也可以用于下行降噪的效果。
技术领域
本申请涉及声音降噪技术领域,尤其是涉及一种基于神经网络的降噪方法、系统、电子设备及存储介质。
背景技术
语音是一种重要的信息载体,随着现代通信技术的不断发展,语音通信逐渐成为人们日常工作中不可或缺的部分。但是在实际通信过程中,信号不可避免的受到环境噪声或者设备本体噪声的干扰,导致语音信号质量下降,影响信号的可懂度,降低人们的听觉体验。目前降噪技术主要有两类,一类是基于传统信号处理方式的降噪,一类是基于神经网络的降噪。
基于传统信号处理的降噪又包含谱减法、维纳滤波法、统计模型法、子空间分解法等,这些方法都依赖于噪声估计,然后将其从语音中剔除。噪声的估计在不同频带分别进行,假设各个频带语音信号功率最低值为噪声功率值,结合各频带能量值的出现概率实现对噪声的跟踪和更新;随后结合谱减、维纳滤波或子空间分解等手段完成语音信号的降噪处理。然而这种噪声估计的方式对噪声的变化响应并不及时,本质上是一种欠估计,也就是说,如果噪声估计的过小可能有噪声残留,如果估计过大可能损伤语音,为了尽可能保留语音信息,这类方法往往降噪效果有限,并且由于这类算法通常假设噪声为平稳加性噪声,其对于非平稳噪声的抑制能力有限。
基于神经网络的降噪方法通常又分为基于映射的方法和基于掩蔽的方法,前者训练神经网络模型学习带噪语音和纯净语音之间的映射关系,再通过这种映射关系对输入语音进行降噪,后者通过训练网络学习一个与输入时频谱大小相同的掩蔽矩阵,降噪时将掩蔽矩阵与输入语音进行点乘,从而获得降噪后的语音。但是,基于神经网络的降噪方法的主要问题在于网络参数多,模型较大(MB级别),在一些低功耗平台上较难实现。
发明内容
为了解决基于神经网络的降噪方法的网络参数多、模型较大(MB级别)、在一些低功耗平台上较难实现的问题,本申请提供一种基于神经网络的降噪方法、系统、电子设备及存储介质。
第一方面,本申请提供的一种基于神经网络的降噪方法,采用如下技术方案:
一种基于神经网络的降噪方法,包括以下步骤:
构建神经网络并训练;
对音频信号进行语音特征提取,并将提取得到的语音特征作为输入信号输入训练好的神经网络中,得到不同频带的增益系数;所述的增益系数均在0-1之间;
将所述增益系数作用于频域信号,并对所述频域信号进行逆傅里叶变换,得到降噪后的语音信号。
通过采用以上技术方案,通过构建神经网络,然后通过所述的神经网络获得0-1之间的增益系数(0意味着这个子带的数据都是噪声,1意味着这个子带的数据都是信号),因此,将实时输入信号(时域)的频域信号(将时域信号转换成频域信号)乘以该增益系数便可以达到降噪的目的,进一步进行逆傅里叶变换即可得到降噪后的语音信号。由于本申请中的神经网络模型结构简单,因而可以在低功耗平台上运行,进而使得基于该神经网络的降噪方法既可以用于上行降噪,也可以用于下行降噪;而且由于本申请中的神经网络模型结构简单,因而使得基于该神经网络的降噪方法也可以对通讯实时性很高的通话、直播场景中的音频进行降噪处理,比如手机通话、微信通话、即时通讯通话、K歌、对讲、直播视频播放等情景模式,使得用户接收到音频听起来更高清、噪声更低。
优选的,所述的神经网络包括:顺次连接的全连接层FC1、激活层ReLU1、长短时记忆层LSTM、全连接层FC2、激活层ReLU2、全连接层FC3、激活层SIGMOID;
和\或
所述的全连接层FC1用于将语音特征映射到隐层空间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京塞宾科技有限公司,未经北京塞宾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110915899.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合型吸波涂料及其制备方法
- 下一篇:一种具有止锁功能的插拔自锁连接器