[发明专利]一种基于深度神经网络的音频降噪方法在审
申请号: | 201810101400.X | 申请日: | 2018-02-01 |
公开(公告)号: | CN108335702A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 余春艳;齐子铭;管发乾;张栋 | 申请(专利权)人: | 福州大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/30 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于深度神经网络的音频降噪方法。该方法为训练和测试两个阶段;在训练阶段,DNN模型的训练数据是由带噪和纯净音频组成的,由于对数频域更符合人耳的听觉系统,因此对输入的音频提取对数功率谱作为特征;在测试阶段,把音色转换后的歌声的对数功率谱输入到从训练阶段得到的DNN模型中,模型的输出就是降噪后音频的对数功率谱,由于人耳的听觉感知对音频的相位信息并不敏感,所以相位信息直接从原始音色转换后的歌声中计算得到,最后结合DNN模型输出的对数功率谱以及相位信息,重建出降噪后的音频。本发明方法能够对音频特别是音色转换后语音和歌声音频的降噪。 | ||
搜索关键词: | 对数功率谱 相位信息 音色转换 降噪 神经网络 训练阶段 音频降噪 歌声 人耳 测试阶段 听觉感知 听觉系统 训练数据 音频提取 输出 频域 语音 测试 敏感 重建 | ||
【主权项】:
1.一种基于深度神经网络的音频降噪方法,其特征在于,包括如下步骤:步骤S1:对数据进行预处理,得到带噪音频数据;步骤S2:训练DNN音频降噪模型,得到的DNN音频降噪模型可以完成音色转换后的歌声的对数功率谱与纯净音频的对数功率谱之间的映射;步骤S3:对音色转换后的歌声进行降噪,即结合步骤S2中训练好的DNN音频降噪模型、输出的对数功率谱以及相位信息,重建出降噪后的音频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810101400.X/,转载请声明来源钻瓜专利网。