[发明专利]语音降噪的训练方法、语音降噪系统及语音降噪方法在审
申请号: | 202211053565.7 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115440240A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 陈锦明;李倩 | 申请(专利权)人: | 恒玄科技(上海)股份有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10L21/0264;G10L25/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陆寅春 |
地址: | 200120 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 训练 方法 系统 | ||
1.一种语音降噪的训练方法,基于深度学习来进行,其特征在于,包括以下步骤:
构建噪声和语音的训练样本;
对不带噪声的语音和带噪声的语音进行傅里叶变换,以获取各自的幅值和相位特征;
将带噪声的语音的幅值输入到神经网络中,通过神经网络处理而得到降噪后的幅值;
将降噪后的幅值与不带噪声的语音的幅值通过模型训练损失函数进行训练,以优化神经网络的权值。
2.如权利要求1所述的语音降噪的训练方法,其特征在于,
所述模型训练损失函数为对数功率谱的正则。
3.如权利要求2所述的语音降噪的训练方法,其特征在于,
所述对数功率谱的正则采用四次正则。
4.如权利要求1-3中任一项所述的语音降噪的训练方法,其特征在于,
所述神经网络为循环神经网络、长短时记忆网络或门控循环单元。
5.如权利要求1所述的语音降噪的训练方法,其特征在于,在优化神经网络的权值后,还包括:
将降噪后的幅值与带噪声的语音的相位特征结合,通过傅里叶逆变换以得到降噪后的语音。
6.一种语音降噪系统,其特征在于,包括:
神经网络模块,该神经网络模块应用权利要求1-5中任一项所述的语音降噪的训练方法,对带噪声的语音进行降噪处理;以及
信号处理模块,该信号处理模块设置在所述神经网络模块的后级,对从所述神经网络模块输出的降噪后的语音进行信号处理,进一步去除噪声。
7.如权利要求6所述的语音降噪系统,其特征在于,
所述神经网络模块用于去除语音的非稳态噪声,所述信号处理模块用于去除语音的稳态噪声。
8.如权利要求7所述的语音降噪系统,其特征在于,
所述稳态噪声为公交、飞机或地铁的噪声,或者为嘈杂人声;
所述非稳态噪声为突发噪声、音乐噪声或无规律的噪声。
9.如权利要求6所述的语音降噪系统,其特征在于,
作为所述信号处理模块中的信号处理方法,采用普减法、维纳滤波法、基于最大似然、最大后验或最小均方估计。
10.一种语音降噪方法,其特征在于,包括:
获取音频信号,其中,所述音频信号包括语音信号、稳态噪声信号和非稳态噪声信号,
利用神经网络模块对所述音频信号执行使所述非稳态噪声信号减小的第一降噪处理,以生成第一降噪信号,
利用信号处理模块对所述第一降噪信号执行使所述稳态噪声信号减小的第二降噪处理,进而生成第二降噪信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒玄科技(上海)股份有限公司,未经恒玄科技(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211053565.7/1.html,转载请声明来源钻瓜专利网。