[发明专利]一种基于膨胀因果卷积的语音降噪方法在审
申请号: | 202010324373.X | 申请日: | 2020-04-23 |
公开(公告)号: | CN111524530A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 陈阳;刘庆云;吴庆婕 | 申请(专利权)人: | 广州清音智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 王泽云 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 膨胀 因果 卷积 语音 方法 | ||
本发明公开了一种基于膨胀因果卷积的语音降噪方法,该方法包括构建网络训练的音频训练集;基于膨胀因果卷积,构建语音降噪网络模型并训练网络模型;使用训练后的模型进行降噪。本发明利用膨胀因果卷积来处理音频时序信息,将感受范围增大,使模型的能力更加优秀。本发明提出的基于膨胀因果卷积的语音降噪方法,在去噪问题上,具有较好的解决能力,对噪声种类的泛化能力也较强。
技术领域
本发明涉及语音降噪技术领域,尤其涉及一种基于膨胀因果卷积的语音降噪方法。
背景技术
对于音频信号的降噪技术一直是语音领域的一个收到极大关注的研究方向,并且具有很大的实用性。通过降噪技术,可以增强原始音频的质量,提高收听的效果。迄今,正在被使用的语音降噪方法主要有谱减法和基于统计模型的方法等。诸如此类的无监督方法,在慢变得噪声条件下,才能取得较好的降噪效果。随着机器学习和深度学习的广泛研究,将深度学习的有监督方法也被成功地应用到语音降噪问题上,并且取得了不错的效果。
基于深度学习的语音降噪方法中的深度神经网络,结构分为输入层,输出层和隐藏层。在语音降噪问题中,我们将带噪的音频信息作为网络的输入信息传到输入层,用纯净不带噪声的音频信息作为输出目标数据去做一个有监督的训练。
发明内容
为解决上述技术问题,本发明的目的是提供一种基于膨胀因果卷积的语音降噪方法。
本发明的目的通过以下的技术方案来实现:
一种基于膨胀因果卷积的语音降噪方法,包括:
S1构建网络训练的音频训练集;
S2基于膨胀因果卷积,构建语音降噪网络模型并训练网络模型;
S3使用训练后的模型进行降噪。
与现有技术相比,本发明的一个或多个实施例可以具有如下优点:
本发明与传统的语音降噪方法不同,采用了深度学习训练神经网络来完成语音降噪任务。通过膨胀因果卷积,提升了卷积效果,扩大了感受范围,最后训练出来的模型能更好地进行语音降噪工作,较好地去除带噪声音频文件中的噪声;
基于膨胀因果卷积的语音降噪方法,在去噪问题上,具有较好的解决能力,对噪声种类的泛化能力也较强。
附图说明
图1为本发明实施例提供的一种基于膨胀因果卷积的语音降噪方法的整体流程图;
图2为本发明实施例提供的一种基于膨胀因果卷积的语音降噪方法的示意图;
图3为膨胀因果卷积的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1和图2所示,为基于膨胀因果卷积的语音降噪方法的整体流程,包括以下步骤:
S1构建网络训练的音频训练集;
S2基于膨胀因果卷积,构建语音降噪网络模型并训练模型;
S3使用训练后的模型进行降噪。
上述S1中所述的音频训练集包括如下音频数据:带噪音频数据以及与之对应的用于监督的纯净音频数据。所述的数据集构建方法为:
S11采集纯净的音频信号和噪声信号。纯净的音频信号采集自TIMIT数据库以及与录音室中录制的纯净不带噪声的语音音频信号,噪声信号同样采集自TIMIT数据库以及录制的噪声音频信号。
S12将纯净的语音音频信号和噪声信号混合,得到带噪声的语音音频信号。合成的方法有单噪声和多噪声的合成方法,有效地丰富了数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州清音智能科技有限公司,未经广州清音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010324373.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种槽钢自动化加工生产线
- 下一篇:一种蜡样芽孢杆菌及其灭活疫苗和应用