[发明专利]一种基于RefineNet的端到端语音增强方法有效
申请号: | 201910549850.X | 申请日: | 2019-06-24 |
公开(公告)号: | CN110246510B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 蓝天;彭川;李森;刘峤;钱宇欣;叶文政;李萌;惠国强;吕忆蓝 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L21/0224;G10L21/0232;G10L25/27 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 refinenet 端到端 语音 增强 方法 | ||
1.一种基于RefineNet的端到端语音增强方法,其特征在于,包括以下步骤:
S1、通过TFANet时频分析网络将原始带噪语音信号变换成含有时频信息的特征图,并输入到RefineNet网络中;
S2、通过RefineNet网络对特征图进行分析,确定原始带噪语音信号到纯净语音信号的特征映射对应的特征图;
S3、根据特征图,通过TFANet时频分析网络重构出增强后的语音信号,实现语音增强;
所述TFANet时频分析网络包括STFT卷积层、取特征图层、解卷积层和语音信号重构层;
所述STFT卷积层的输出端与取特征图层连接,所述取特征图层的输出端分别与RefineNet网络的输入端和解卷积层的输出端连接;
所述解卷积层的输入端与RefineNet网络的输出端连接,所述解卷积层的输出端与语音信号重构层连接;
所述RefineNet网络包括输入单元、ResBlock单元组、RefineBlock单元组和输出单元;
所述ResBlock单元组包括第一ResBlock单元、第二ResBlock单元、第三ResBlock单元和第四ResBlock单元;
所述RefineBlock单元组包括第一RefineBlock单元、第二RefineBlock单元、第三RefineBlock单元和第四RefineBlock单元;
所述输入单元、第一ResBlock单元、第二ResBlock单元、第三ResBlock单元和第四ResBlock单元依次连接;
所述第四RefineBlock单元、第三RefineBlock单元、第二RefineBlock单元和第一RefineBlock单元和输出单元依次连接;
所述第一ResBlock单元还与第一RefineBlock单元连接,所述第二ResBlock单元还与第二RefineBlock单元连接,所述第三ResBlock单元还与第三RefineBlock单元连接,所述第四ResBlock单元还与第四RefineBlock单元连接。
2.根据权利要求1所述的基于RefineNet的端到端语音增强方法,其特征在于,所述输入单元包括依次连接的7×7的卷积层和池化层,所述池化层与第一ResBlock单元连接;
所述7×7的卷积层的步长为2;
所述池化层的步长为2;
所述第一ResBlock单元、第二ResBlock单元、第三ResBlock单元和第四ResBlock单元均包括第一卷积组、第二卷积组、第一残差连接和第二残差连接;
所述第一卷积组包括依次连接的第一1×1的卷积层、第一3×3的卷积层和第二1×1的卷积层;
所述第二卷积组包括依次连接的第三1×1的卷积层、第二3×3的卷积层和第四1×1的卷积层;
所述第一1×1的卷积层的输入端还与第五1×1的卷积层的输入端连接;
所述第二1×1的卷积层的输出端和第五1×1的卷积层的输出端与第一残差连接的输入端连接,所述第一残差连接的输出端分别与第三1×1的卷积层的输入端和第二残差连接的输入端连接,所述第二残差连接的输入端还与第四1×1的卷积层的输出端连接,所述第二残差连接的输出端作为一个ResBlock单元的输出端;
所述第一ResBlock单元的输出通道的个数为256;其中,各个卷积层的步长均为1;
所述第二ResBlock单元的输出通道的个数为512;其中,第一3×3的卷积层、第二3×3的卷积层和第五1×1的卷积层的步长均为2,第一1×1的卷积层、第二1×1的卷积层、第三1×1的卷积层和第四1×1的卷积层的步长均为1;
所述第三ResBlock单元的输出通道的个数为1024;其中,第一3×3的卷积层、第二3×3的卷积层和第五1×1的卷积层的步长均为2,第一1×1的卷积层、第二1×1的卷积层、第三1×1的卷积层和第四1×1的卷积层的步长均为1;
所述第四ResBlock单元的输出通道的个数为2048;其中,第一3×3的卷积层、第二3×3的卷积层和第五1×1的卷积层的步长均为2,所述第一1×1的卷积层、第二1×1的卷积层、第三1×1的卷积层和第四1×1的卷积层的步长均为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549850.X/1.html,转载请声明来源钻瓜专利网。