[发明专利]音频降噪方法和音频降噪模型的训练方法在审
申请号: | 202010658159.8 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111883091A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 胡诗超;赵伟峰 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10H1/36 | 分类号: | G10H1/36;G10L19/02;G10L21/0216;G10L21/0232;G10L25/30 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 模型 训练 | ||
1.一种音频降噪方法,其特征在于,包括:
获取待降噪音频信号;
对所述待降噪音频信号进行处理以获得频谱特征;
将所述频谱特征输入卷积网络模型进行处理,以获得频谱卷积特征;
将所述频谱卷积特征输入循环网络模型进行处理,以获得目标频谱或目标频谱掩码;
对所述目标频谱进行处理,以获得目标音频信号;或使用所述目标频谱掩码对所述待降噪音频信号进行处理,以获得目标音频信号。
2.如权利要求1所述的音频降噪方法,其特征在于,使用所述目标频谱掩码对所述待降噪音频信号进行处理,以获得目标音频信号的步骤包括:
根据所述目标频谱掩码对所述待降噪音频信号的频谱特征进行计算,并根据计算后的频谱特征生成目标频谱;
对所述目标频谱进行处理,以获得目标音频信号。
3.如权利要求1所述的音频降噪方法,其特征在于,将所述频谱卷积特征输入循环网络模型进行处理,以获得目标频谱或目标频谱掩码的步骤包括:
将所述频谱卷积特征输入循环网络模型,以得到频谱循环特征;
将所述频谱循环特征输入至全连接网络,以得到目标频谱或目标频谱掩码。
4.如权利要求1所述的音频降噪方法,其特征在于,对所述待降噪音频信号进行处理以获得频谱特征的步骤包括:
对所述待降噪音频信号的时域波形进行短时傅里叶变换,以得到变换后的初始频谱;
提取所述初始频谱的幅值特征和相位特征。
5.如权利要求1-4任一项所述的音频降噪方法,其特征在于,对所述目标频谱进行处理,以获得目标音频信号;或使用所述目标频谱掩码对所述待降噪音频信号进行处理,以获得目标音频信号的步骤包括:
根据所述目标频谱、幅值特征以及相位特征计算目标复数频谱;或根据所述目标频谱掩码、幅值特征以及相位特征计算目标复数频谱;
对所述目标复数频谱进行短时傅里叶反变换生成目标音频信号。
6.如权利要求5所述的音频降噪方法,其特征在于,根据所述目标频谱、幅值特征以及相位特征计算目标复数频谱的步骤包括;
根据第一公式计算目标复数频谱,其中所述第一公式为:
Ct=Yt_abs*exp^(1j*Xt_phase)
其中,Yt_abs为目标频谱的频谱幅值,Xt_phase为初始频谱的相位特征。
7.如权利要求5所述的音频降噪方法,其特征在于,根据所述目标频谱掩码、幅值特征以及相位特征计算目标复数频谱的步骤包括:
根据第二公式计算目标复数频谱,其中所述第二公式为:
Ct=Xt_abs*mask_t*exp^(1j*Xt_phase)
其中,Xt_abs为初始频谱的幅值特征,Xt_phase为初始频谱的相位特征,mask_t为目标频谱掩码。
8.一种音频降噪模型的训练方法,其特征在于,包括:
获取包含噪声的目标歌曲对应的第一音频和不包含噪声的目标歌曲对应的第二音频;
获取第一音频频谱的幅值特征以及第二音频的音频特征;
根据所述第一音频频谱的幅值特征以及第二音频的音频特征对预设音频降噪模型进行训练,所述预设音频降噪模型包括多层卷积神经网络和两层循环神经网络。
9.如权利要求8所述的音频降噪模型的训练方法,其特征在于,根据所述第一音频频谱的幅值特征以及第二音频的音频特征对预设音频降噪模型进行训练的步骤包括:
将所述第一音频频谱的幅值特征输入所述预设音频降噪模型,得到降噪后的第三音频的音频特征;
计算所述第三音频的音频特征与第二音频的音频特征之间的误差;
根据所述误差对所述预设音频降噪模型进行迭代训练。
10.如权利要求9所述的音频降噪模型的训练方法,所述预设音频降噪模型还包括深度神经网络,其特征在于,将所述第一音频频谱的幅值特征输入所述预设神经网络模型,得到降噪后的第三音频的音频特征的步骤包括:
将所述第一音频频谱的幅值特征输入所述预设神经网络模型,并将循环神经网络的时间序列的中间序列特征或者最后一个序列特征输入至深度神经网络,以得到降噪后的第三音频的音频特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010658159.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人像识别的人工智能门铃信息提醒方法及装置
- 下一篇:一种温控旋钮开关