[发明专利]基于深度完全卷积神经网络的生成对抗网络语音增强方法有效
申请号: | 201910755047.1 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110619885B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 李立欣;程倩倩;李旭;程岳 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L25/30;G10L25/60;G06N3/04 |
代理公司: | 西安维赛恩专利代理事务所(普通合伙) 61257 | 代理人: | 刘艳霞 |
地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于深度完全卷积神经网络的生成对抗网络语音增强方法,解决了现有高噪声环境下语音信号质量差的问题。该方法包括以下步骤:步骤一、构建一个数据集,包含含噪语音信号和纯净语音信号;获得所述含噪语音信号的语谱图,将语谱图作为生成对抗网络中生成器G的输入;步骤二、生成器G对步骤一所生成的语谱图进行处理,将生成器构建为编码器‑译码器结构,通过编码器部分获得潜在向量z,然后潜在向量z经过译码器部分获得语音信号的输出信号;步骤三、设置判别器D的结构,然后将所述步骤二中的输出信号和所述步骤一中的纯净语音信号作为判别器D的输入,两者不断交互对抗、训练,直至达到平衡,获得增强语音信号。 | ||
搜索关键词: | 基于 深度 完全 卷积 神经网络 生成 对抗 网络 语音 增强 方法 | ||
【主权项】:
1.基于深度完全卷积神经网络的生成对抗网络语音增强方法,其特征在于,包括以下步骤:/n步骤一、构建一个数据集,包含含噪语音信号,以及与所述含噪语音信号相对应的纯净语音信号;获得所述含噪语音信号的语谱图,将语谱图作为生成对抗网络中生成器G的输入;/n步骤二、基于深度完全卷积神经网络的生成对抗网络模型的生成器G对步骤一所生成的语谱图进行处理,将生成器构建为编码器-译码器结构,通过编码器部分获得潜在向量z,然后潜在向量z经过译码器部分获得语音信号的输出信号;/n步骤三、设置判别器D的结构,然后将所述步骤二中的输出信号和所述步骤一中的纯净语音信号作为判别器D的输入,判别器将结果反馈给生成器,根据系统目标函数,两者不断交互对抗、训练,直至达到平衡,获得增强语音信号。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910755047.1/,转载请声明来源钻瓜专利网。
- 上一篇:音频编码方法和装置
- 下一篇:一种针对低资源土家语的端到端语音增强方法