[发明专利]语音增强方法、电子设备和存储介质在审

专利信息
申请号: 202211626526.1 申请日: 2022-12-16
公开(公告)号: CN116013343A 公开(公告)日: 2023-04-25
发明(设计)人: 俞凯;江文斌 申请(专利权)人: 思必驰科技股份有限公司
主分类号: G10L21/0208 分类号: G10L21/0208;G10L25/30
代理公司: 北京商专永信知识产权代理事务所(普通合伙) 11400 代理人: 邓婷婷;黄谦
地址: 215123 江苏省苏州市苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 增强 方法 电子设备 存储 介质
【权利要求书】:

1.一种语音增强方法,用于语音增强系统,其中,所述语音增强系统包括编码器模块、双路模块、解码器模块和合并模块,所述解码器模块包括激励解码器、声道解码器和复数谱解码器,所述方法包括:

利用所述编码器模块提取原始带噪语音信号中的预设特征;

利用所述双路模块对所述预设特征在频率轴进行建模处理得到频率轴特征,利用所述双路模块对所述频率轴特征在时间轴进行建模处理得到时间轴特征;

利用所述激励解码器和所述声道解码器对所述时间轴特征进行处理得到时间轴分支的第一降噪语音信号;

利用所述复数谱解码器对所述频率轴特征进行处理得到频率轴分支的第二降噪语音信号;

利用所述合并模块将所述第一降噪语音信号、所述第二降噪语音信号和所述原始带噪语音信号进行合并得到最终的估计语音信号。

2.根据权利要求1所述的方法,其中,所述利用所述双路模块对所述预设特征在频率轴进行建模处理得到频率轴特征包括:

对所述预设特征进行第一次矩阵变维处理;

将第一次矩阵变维处理后的特征输入至频率序列层进行处理;

对所述频率序列层输出的特征进行第二次矩阵变维处理;

对第二次矩阵变维处理后的特征进行层归一化处理得到频率轴特征。

3.根据权利要求2所述的方法,其中,所述利用所述双路模块对所述频率轴特征在时间轴进行建模处理得到时间轴特征包括:

对所述频率轴特征进行第一次矩阵变维处理;

将第一次矩阵变维处理后的特征输入至时间序列层进行处理;

对所述时间序列层输出的特征进行第二次矩阵变维处理;

对第二次矩阵变维处理后的特征进行层归一化处理得到时间轴特征。

4.根据权利要求3所述的方法,其中,在所述频率轴建模的输入与所述频率轴建模的输出之间包括第一跳跃连接,在所述时间轴建模的输入与所述时间轴建模的输出之间包括第二跳跃连接,所述第一跳跃连接与所述第二跳跃连接均使用矩阵元素相加。

5.根据权利要求1所述的方法,其中,所述编码器模块包括M个二维卷积模块,每一所述二维卷积模块包括一个二维反卷积层,一个批归一化层和一个PReLU激活层;所述解码器模块中的每一种解码器包括M个二维反卷积模块,每一所述二维反卷积模块包括一个二维反卷积层,一个批归一化层和一个PReLU激活层。

6.根据权利要求5所述的方法,其中,每个所述二维卷积模块和对应的所述二维反卷积模块通过卷积注意力模块进行跳跃连接,所述卷积注意力模块包括通道注意力子模块和频率注意力子模块,所述通道注意力子模块在数据的通道轴进行处理,所述频率注意力子模块在所述频率轴进行处理,所述通道注意力子模块的输出和所述频率注意力子模块的输出均通过使用矩阵元素相乘得到。

7.根据权利要求1-6中任一项所述的方法,其中,所述语音增强系统在训练时将所述估计语音信号与预期的纯净语音信号计算代价函数误差,将所述代价函数误差使用反向传播更新所述语音增强系统的神经网络模型参数,训练时每一轮对训练数据进行随机打乱,以不断迭代更新所述模型参数,直至所述代价函数误差不再明显减少时停止训练。

8.根据权利要求7所述的方法,其中,所述代价函数包括在多尺度短时傅里叶代价函数的基础上添加时域的L1代价函数。

9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。

10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211626526.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top