[发明专利]一种基于深度神经网络的语音增强方法在审
申请号: | 201811653295.7 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109658949A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 李湑;李秋俊;陈毅;彭鑫;黄胜 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/02;G10L25/30;G10L25/03 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 为了解决传统基于特征映射的DNN语音增强方法噪声鲁棒性差、特征映射不准确、增强语音存在频谱失真等缺点,提出了一种基于深度神经网络的语音增强方法。首先提出并搭建基于动态噪声和语音联合感知训练的特征映射深度神经网络模型(DNAT‑DSAT‑DNN),学习带噪语音信号和纯净语音信号之间的特征映射关系,进而得到增强语音信号的对数功率谱特征值;其次利用带噪语音信号、纯净语音信号和噪声信号三者的几何关系,求得增强语音信号的相位信息;最后利用重叠相加原理恢复出增强语音信号的时域表示。 | ||
搜索关键词: | 语音信号 语音增强 映射 纯净语音信号 神经网络 语音 神经网络模型 对数功率谱 噪声鲁棒性 动态噪声 感知训练 几何关系 时域表示 相位信息 映射关系 噪声信号 频谱 失真 相加 恢复 联合 学习 | ||
【主权项】:
1.一种基于深度神经网络的语音增强方法,其特征在于,包括以下步骤:步骤101:搭建并训练基于DNAT‑DSAT‑DNN的特征映射深度神经网络;步骤102:利用几何关系求解增强语音信号的相位信息;步骤103:利用重叠相加原理恢复得到增强语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811653295.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种面向候鸟迁徙活动的声学监测方法
- 下一篇:一种混合频域自适应算法