[发明专利]一种音频增强方法、装置、电子设备和存储介质在审
申请号: | 202211167895.9 | 申请日: | 2022-09-23 |
公开(公告)号: | CN115602183A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 周阳 | 申请(专利权)人: | 广州博冠信息科技有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0272;G10L25/30 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 汪阮磊 |
地址: | 510663 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 增强 方法 装置 电子设备 存储 介质 | ||
1.一种音频增强方法,其特征在于,包括:
获取包括样本无噪音频以及样本噪声音频的音频集合,基于所述样本无噪音频和所述样本噪声音频,生成样本混合音频;
通过待训练的音频增强模型对所述样本混合音频进行噪声分离,得到训练无噪音频和训练噪声音频;
根据所述样本无噪音频、样本噪声音频、样本混合音频、训练无噪音频和训练噪声音频,计算所述待训练的音频增强模型对应的模型损失;
基于所述模型损失,对所述待训练的音频增强模型进行调整,得到训练后的音频增强模型,以通过所述训练后的音频增强模型对待增强音频进行音频增强。
2.根据权利要求1所述的音频增强方法,其特征在于,所述根据所述样本无噪音频、样本噪声音频、样本混合音频、训练无噪音频和训练噪声音频,计算所述待训练的音频增强模型对应的模型损失,包括:
根据所述样本无噪音频和所述训练无噪音频,计算所述待训练的音频增强模型的无噪音频训练损失;
根据所述样本噪声音频和所述训练噪声音频,计算所述待训练的音频增强模型的噪声音频训练损失;
混合所述训练无噪音频和训练噪声音频得到训练混合音频,根据所述训练混合音频和所述样本混合音频,计算所述待训练的音频增强模型的混合音频训练损失;
基于所述无噪音频训练损失、所述噪声音频训练损失和所述混合音频训练损失,计算所述待训练的音频增强模型对应的模型损失。
3.根据权利要求2所述的音频增强方法,其特征在于,所述基于所述无噪音频训练损失、所述噪声音频训练损失和所述混合音频训练损失,计算所述待训练的音频增强模型对应的模型损失,包括:
获取所述无噪音频训练损失对应的第一损失权重、所述噪声音频训练损失对应的第二损失权重以及所述混合音频训练损失对应的第三损失权重;
根据所述第一损失权重、所述第二损失权重和所述第三损失权重,对所述无噪音频训练损失、所述噪声音频训练损失以及所述混合音频训练损失进行加权计算,得到所述待训练的音频增强模型对应的模型损失。
4.根据权利要求1所述的音频增强方法,其特征在于,所述通过待训练的音频增强模型对所述样本混合音频进行噪声分离,得到训练无噪音频和训练噪声音频,包括:
通过待训练的音频增强模型的编码层将所述样本混合音频的频域表示映射为所述样本混合音频的初始特征;
通过所述待训练的音频增强模型的特征提取层针对所述初始特征的至少两个子特征分别进行特征提取,得到各所述子特征的频谱特征,以及,针对所述至少两个子特征进行特征间关系提取,得到各所述子特征之间的频谱联系特征;
将各所述频谱特征和所述频谱联系特征,通过所述待训练的音频增强模型的解码层进行解码映射,得到训练无噪音频的频域表示和训练噪声音频的频域表示;
根据所述训练无噪音频的频域表示和所述训练噪声音频的频域表示,得到训练无噪音频和训练噪声音频。
5.根据权利要求1-4任一项所述的音频增强方法,其特征在于,所述方法还包括:
获取所述待增强音频;
采用所述训练后的音频增强模型对待增强音频进行音频增强,得到所述待增强音频对应的增强后音频。
6.根据权利要求5所述的音频增强方法,其特征在于,所述获取所述待增强音频,包括:
获取所述待增强音频的时域表示,将所述时域表示转换为预设数量的频域表示,所述预设数量至少为2;
从所述待增强音频的各所述频域表示中确定各所述频域表示对应的实部特征和虚部特征,对所述实部特征和虚部特征进行融合,得到所述待增强音频对应的待处理特征;
所述采用所述训练后的音频增强模型对待增强音频进行音频增强,得到所述待增强音频对应的增强后音频,包括:
采用所述训练后的所述音频增强模型,对所述待处理特征进行噪声分离处理,得到所述待增强音频对应的增强后音频的增强实部特征和增强虚部特征,所述增强实部特征和所述增强虚部特征的数量均与所述预设数量相同;
基于所述增强实部特征和增强虚部特征进行时域转换,得到所述待增强音频对应的增强后音频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博冠信息科技有限公司,未经广州博冠信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211167895.9/1.html,转载请声明来源钻瓜专利网。