[发明专利]一种基于双通道卷积注意力网络的语音增强方法及系统在审
申请号: | 202110999879.5 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113611323A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 雷斌 | 申请(专利权)人: | 北京至芯开源科技有限责任公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0224;G10L21/0232;G10L25/30;G10L25/45 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 陈月婷 |
地址: | 101318 北京市顺义区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于双通道卷积注意力网络的语音增强方法,包括以下步骤:首先对时域带噪语音进行加窗分帧,并对分帧结果进行傅里叶变换转换到时频域,提取带噪语音的对数幅度谱特征作为模型的输入特征;然后将输入特征分别送入卷积神经网络通道和长短时记忆网络通道中进行深层特征提取,并在两个通道中分别添加卷积注意力模块和空间注意力模块,用于对两个通道中产生的特征图自适应调整;进一步完成增强语音对数幅度谱特征的预测;最后将预测结果和带噪语音相位结合得到增强语音的频域表示,并通过逆傅里叶变换转换回时域,再利用重叠相加的方法完成增强语音的整体合成。本发明能够有效提高了增强语音的质量和可懂度。 | ||
搜索关键词: | 一种 基于 双通道 卷积 注意力 网络 语音 增强 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京至芯开源科技有限责任公司,未经北京至芯开源科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110999879.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种废轮胎处理回收方法
- 下一篇:一种显示屏组件和制造方法