[发明专利]音频去噪方法、装置、用户终端及存储介质在审
申请号: | 201910507564.7 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110222781A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 尹学渊;江天宇;陈洪宇;梁超 | 申请(专利权)人: | 成都嗨翻屋科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G10L19/028;G10L25/27;G10L25/84 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 贺理兴 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 去噪 存储介质 二维数组 用户终端 初始相位图 波形序列 点乘运算 目标波形 音频文件 目标语 离散傅立叶逆变换 离散傅立叶变换 音频处理技术 目标音频 网络模型 序列转换 采样 残差 卷积 取模 运算 | ||
本发明公开了一种音频去噪方法、装置、用户终端及存储介质,涉及音频处理技术领域。该方法包括:对初始音频文件采样得到初始波形序列;对初始波形序列进行离散傅立叶变换,得到对应的初始二维数组;对初始二维数组进行取模操作,得到对应的初始语谱图;对初始二维数组进行取相位操作,得到对应的初始相位图;将初始语谱图作为训练好的卷积残差网络模型的输入进行运算,得到去噪后的目标语谱图;将目标语谱图与初始相位图进行点乘运算;对点乘运算结果进行离散傅立叶逆变换,得到去噪后的目标波形序列;将目标波形序列转换为音频文件,得到去噪后的目标音频文件。本发明公开的音频去噪方法、装置、用户终端及存储介质去噪方便且去噪效果好。
技术领域
本发明涉及音频处理技术领域,尤其是涉及一种音频去噪方法、装置、用户终端及存储介质。
背景技术
在生活中,我们随处能听到声音。声音在电脑中的应用我们称为音频文件,在音频文件播放的过程中,使收听者听起来感觉刺耳的部分,我们称之为噪声。这些噪声一般在音频生成或录制中产生,是不可避免的。噪声的存在影响着整个音频对信息的表达。不仅是重要音频文件的保存,还是音频的后期应用,如乐器识别、歌手识别、伴奏提取等,都需要无噪声的纯净音频。因此,音频去噪技术在现实生活中有很重要的地位。
目前,音频去噪都是在音频处理软件中完成的,过程大致为手工寻找噪声,然后在原始音频上手工剪去寻找到的噪声完成的,这需要大量的人工操作和时间。
发明内容
有鉴于此,本发明的目的在于提提供一种音频去噪方法、装置、用户终端及存储介质,以改善上述问题。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明实施例提供了一种音频去噪方法,应用于用户终端,所述方法包括:
对初始音频文件进行采样得到初始波形序列;
对所述初始波形序列进行离散傅立叶变换,得到对应的初始二维数组;
对所述初始二维数组进行取模操作,得到与所述初始二维数组对应的初始语谱图;
对所述初始二维数组进行取相位操作,得到与所述初始二维数组对应的初始相位图;
将所述初始语谱图作为预先训练好的卷积残差网络模型的输入进行运算,得到去噪后的目标语谱图;
将所述目标语谱图与所述初始相位图进行点乘运算;
对点乘运算的结果进行离散傅立叶逆变换,得到去噪后的目标波形序列;
将所述目标波形序列转换为音频文件,得到去噪后的目标音频文件。
可选的,所述方法还包括:
根据纯净音频文件制作数据集,所述数据集包括所述纯净音频文件和依据所述纯净音频文件加入噪声的噪声音频文件;
对所述数据集中的训练音频文件进行采样,得到对应的训练波形序列,所述训练音频文件包括所述纯净音频文件和所述噪声音频文件;
对每个训练波形序列进行离散傅立叶变换,得到对应的训练二维数组;
对每个训练二维数组进行取模运算,得到对应的训练语谱图;
对每张训练语谱图进行归一化处理,得到目标训练集;
将所述目标训练集进行切片,得到多批训练数据;
将与所述噪声音频文件对应的训练数据作为输入,与所述纯净音频文件对应的训练数据作为目标进行训练,得到训练好的卷积残差网络模型。
可选的,所述卷积残差网络模型为RnCnn卷积残差网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都嗨翻屋科技有限公司,未经成都嗨翻屋科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910507564.7/2.html,转载请声明来源钻瓜专利网。