[发明专利]基于频谱压缩和神经网络的多阶段全频带语音增强方法在审
申请号: | 202210684643.7 | 申请日: | 2022-06-17 |
公开(公告)号: | CN115273884A | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 侯仲舒;胡沁雯;卢晶;朱长宝;朱天一;刘松 | 申请(专利权)人: | 南京大学;北京地平线信息技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/30 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于频谱压缩和神经网络的多阶段全频带语音增强方法。其步骤为:设计全频带语音频谱压缩曲线,使用设计的参数初始化MHA‑DPCRN的频谱压缩模块;合成模拟含噪混响语音;对模拟含噪混响语音和对应的带混响纯净语音分别做短时傅里叶变换得到两者的短时傅里叶谱;使用短时傅里叶谱训练MHA‑DPCRN模型权重;(5)对待增强的含噪混响语音做短时傅里叶变换得到短时傅里叶谱;将含噪混响语音的短时傅里叶谱输入完成训练的模型,得到增强语音的短时傅里叶谱,并进行逆短时傅里叶变换得到增强语音的时域信号。本发明的方法能够在复杂噪声场景下对全频带语音进行较为彻底的噪声抑制,同时保留较好的语音音质。 | ||
搜索关键词: | 基于 频谱 压缩 神经网络 阶段 频带 语音 增强 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;北京地平线信息技术有限公司,未经南京大学;北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210684643.7/,转载请声明来源钻瓜专利网。