[发明专利]音频降噪方法和音频降噪模型的训练方法在审
申请号: | 202010658159.8 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111883091A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 胡诗超;赵伟峰 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10H1/36 | 分类号: | G10H1/36;G10L19/02;G10L21/0216;G10L21/0232;G10L25/30 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 模型 训练 | ||
本发明实施例公开了一种音频降噪方法和音频降噪模型的训练方法。该方案可以获取待降噪音频信号,对待降噪音频信号进行处理以获得频谱特征,将频谱特征输入卷积网络模型进行处理,以获得频谱卷积特征,将频谱卷积特征输入循环网络模型进行处理,以获得目标频谱或目标频谱掩码,对目标频谱进行处理,以获得目标音频信号;或使用目标频谱掩码对待降噪音频信号进行处理,以获得目标音频信号。本申请实施例通过将神经网络结构应用于K歌录制的歌声降噪,从而在对带噪歌声进行有效降噪的同时,也能很好地保持歌声原本的信号结构,避免了降噪后明显的听感失真。
技术领域
本发明涉及数据处理技术领域,具体涉及一种音频降噪方法和音频降噪模型的训练方法。
背景技术
近些年来,移动端K歌软件的市场规模逐渐扩大,用户群体遍布各个年龄段以及各种音乐层次。特别是随着智能手机、平板电脑等智能终端的普及,使得用户足不出户进行K歌成为了一种可能。比如,用户在智能手机上安装了K歌软件后,无需走进KTV便可实现歌曲演唱。其中此类软件的主要场景之一就是录歌,也就是伴奏与人声两路音频信号,通过信号处理技术最终产生合成作品的一路音频信号数据。
目前使用市面上的K歌APP录音时,受限于非专业设备和环境,用户录制的歌声里很容易混入噪声(麦克风摩擦音,环境背景杂音等),对听感有较大的影响。因此,对录制的歌声进行降噪很有必要。现有的歌声降噪方案都是基于传统数字信号处理,使用各种有效的频域转换和时域变换估计噪声频谱,然后从录制的信号中提取纯净的人声信号。比如在原始带噪歌声信号的基础上,利用统计信号处理的方法估计原始信号中的噪声部分的功率谱等特征,然后通过计算得到的噪声信号的功率谱等特征,从原始带噪歌声信号中预测降噪后的歌声信号。
申请人发现,这种传统的降噪方法只针对某些特定类型的噪声(稳态噪声等)有一定的降噪作用,对其他更复杂多变的背景噪声(如非稳态)难以有理想的效果。此外,传统的歌声降噪方法在降噪过程中容易对原本的人声信号引入失真。
发明内容
本发明实施例提供一种音频降噪方法和音频降噪模型的训练方法,可以提升音频的降噪效果。
本发明实施例提供一种音频降噪方法,包括:
获取待降噪音频信号;
对所述待降噪音频信号进行处理以获得频谱特征;
将所述频谱特征输入卷积网络模型进行处理,以获得频谱卷积特征;
将所述频谱卷积特征输入循环网络模型进行处理,以获得目标频谱或目标频谱掩码;
对所述目标频谱进行处理,以获得目标音频信号;或使用所述目标频谱掩码对所述待降噪音频信号进行处理,以获得目标音频信号。
本发明实施例还提供一种音频降噪模型的训练方法,包括:
获取包含噪声的目标歌曲对应的第一音频和不包含噪声的目标歌曲对应的第二音频;
获取第一音频频谱的幅值特征以及第二音频的音频特征;
根据所述第一音频频谱的幅值特征以及第二音频的音频特征对预设音频降噪模型进行训练,所述预设音频降噪模型包括多层卷积神经网络和两层循环神经网络。
本发明实施例提供的音频降噪方案,可以获取待降噪音频信号,对待降噪音频信号进行处理以获得频谱特征,将频谱特征输入卷积网络模型进行处理,以获得频谱卷积特征,将频谱卷积特征输入循环网络模型进行处理,以获得目标频谱或目标频谱掩码,对目标频谱进行处理,以获得目标音频信号;或使用目标频谱掩码对待降噪音频信号进行处理,以获得目标音频信号。本申请实施例通过将神经网络结构应用于K歌录制的歌声降噪,从而在对带噪歌声进行有效降噪的同时,也能很好地保持歌声原本的信号结构,避免了降噪后明显的听感失真。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010658159.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人像识别的人工智能门铃信息提醒方法及装置
- 下一篇:一种温控旋钮开关