[发明专利]一种基于时频域生成对抗网络的语音增强方法有效
申请号: | 202110167844.5 | 申请日: | 2021-02-07 |
公开(公告)号: | CN112802491B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 高戈;尹文兵;陈怡;杨玉红;曾邦;王霄 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232;G10L25/30;G10L19/02 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于时频域生成对抗网络的语音增强方法,在传统的基于时频域生成对抗网络的语音增强方法的基础上,通过增加一个频域鉴别器,使语音增强模型能够同时学习到输入语音的时域特征和频域特征,以提高模型的性能。其中,时域鉴别器直接判别生成器输出的增强语音;频域鉴别器则对增强语音做短时傅里叶变换后得到频域特征进行判别。模型训练时,时域和频域鉴别器同时监督生成器,使生成器能够同时学习到语音和噪声的时域和频域特征。并且,为了保留原始语音的底层信息和防止生成器产生过拟合,在模型的损失函数中加入频域约束项。本发明方法增强性能更好,且其能处理的噪声种类更多、适用的场景更广。 | ||
搜索关键词: | 一种 基于 时频域 生成 对抗 网络 语音 增强 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110167844.5/,转载请声明来源钻瓜专利网。
- 上一篇:结合长时序数据和机器学习算法的热融塘状态识别方法
- 下一篇:大数据处理系统