[发明专利]音频信号降噪模型的训练方法、音频信号降噪方法及设备在审
申请号: | 201911373964.X | 申请日: | 2019-12-27 |
公开(公告)号: | CN113053400A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 毛鑫;刘阳兴;张传昊 | 申请(专利权)人: | 武汉TCL集团工业研究院有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/30 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李娟 |
地址: | 430000 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 模型 训练 方法 设备 | ||
1.一种音频信号降噪模型的训练方法,其特征在于,包括:
对样本带噪音频信号进行预处理,得到样本带噪音频向量;
将样本带噪音频信号对应的样本带噪音频向量输入深度学习网络进行噪声分离处理,得到分离音频信号和分离噪声信号;
基于所述样本带噪音频信号对应的样本音频信号、样本噪声信号,以及所述分离音频信号、分离噪声信号,对所述深度学习网络的模型参数进行修正,直至所述深度学习网络的训练情况满足预设条件,得到音频信号降噪模型。
2.如权利要求1所述的音频信号降噪模型的训练方法,其特征在于,所述样本带噪音频信号根据样本音频信号和样本噪声信号生成。
3.如权利要求1所述的音频信号降噪模型的训练方法,其特征在于,所述深度学习网络包括比值膜估计层以及噪声分离层;
所述将样本带噪音频信号对应的样本带噪音频向量输入深度学习网络进行噪声分离处理,得到分离音频信号和分离噪声信号,包括:
将样本带噪音频信号对应的样本带噪音频向量输入深度学习网络的比值膜估计层进行处理,得到音频比值膜向量以及噪声比值膜向量;
将所述样本带噪音频向量、所述音频比值膜向量以及所述噪声比值膜向量输入所述噪声分离层进行处理,得到所述样本带噪音频信号对应的分离音频信号和分离噪声信号。
4.如权利要求3所述的音频信号降噪模型的训练方法,其特征在于,所述基于所述样本带噪音频信号对应的样本音频信号、样本噪声信号,以及所述分离音频信号、分离噪声信号,对所述深度学习网络的模型参数进行修正,直至所述深度学习网络的训练情况满足预设条件,得到音频信号降噪模型,包括:
当第一信噪比和第二信噪比之间的均值不符合预设要求时,修正所述深度学习网络的模型参数,返回执行所述将样本带噪音频信号对应的样本带噪音频向量输入深度学习网络的比值膜估计层进行处理,得到音频比值膜向量以及噪声比值膜向量以及后续步骤;其中,所述第一信噪比基于所述样本带噪音频信号对应的样本音频信号以及分离音频信号计算得到,所述第二信噪比基于所述样本带噪音频信号对应的样本噪声信号以及分离噪声信号计算得到;
当所述第一信噪比和所述第二信噪比之间的均值符合预设要求时,停止训练所述深度学习网络,并将训练后的深度学习网络作为所述音频信号降噪模型。
5.如权利要求3或4所述的音频信号降噪模型的训练方法,其特征在于,所述比值膜估计层包括多个扩张因果卷积层;
所述将样本带噪音频信号对应的样本带噪音频向量输入深度学习网络的比值膜估计层进行处理,得到音频比值膜向量以及噪声比值膜向量,包括:
将样本带噪音频信号对应的样本带噪音频向量进行归一化处理,得到样本归一化向量;
将所述样本归一化向量输入所述比值膜估计层的多个扩张因果卷积层进行处理,得到样本带噪音频信号对应的音频比值膜向量以及噪声比值膜向量;其中,每个扩张因果卷积层输出的特征向量作为与其相邻的下一个扩张因果卷积层的输入,所述特征向量包含所述样本带噪音频信号中的音频信号的特征信息和噪声信号的特征信息,最后一个扩张因果卷积层输出样本带噪音频信号对应的音频比值膜向量以及噪声比值膜向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉TCL集团工业研究院有限公司,未经武汉TCL集团工业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911373964.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微通道板固定装置
- 下一篇:展开式椎骨撑开装置