[发明专利]一种基于DNN-CLSTM网络的语音增强方法在审

申请号：	202011323987.2	申请日：	2020-11-23
公开（公告）号：	CN112735456A	公开（公告）日：	2021-04-30
发明（设计）人：	汪友明;张天琦	申请（专利权）人：	西安邮电大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0216;G10L25/24;G10L25/30
代理公司：	西安佳士成专利代理事务所合伙企业(普通合伙) 61243	代理人：	李丹
地址：	710121 陕西省西安市***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明是一种基于深度神经网络和残差长短时记忆网络(DNN‑CLSTM)的语音增强方法。此方法将谱减法获取的语音幅值特征和快速傅里叶变换获取的语音梅尔倒谱系数(MFCC)特征输入至DNN‑CLSTM网络模型，实现语音增强的目的。首先，对含噪语音进行时频掩蔽和加窗分帧处理，利用快速傅里叶变换获取含噪语音的幅值和相位特征，并估计出含噪语音的噪声幅值；然后，用含噪语音幅值减去估计的噪声信号幅值，得到谱减后的语音信号幅值作为神经网络输入的第一特征。其次，对含噪语音进行快速傅里叶变换(FFT)，求取语音信号的谱线能量进而得到含噪语音的MFCC特征作为语音信号的第二特征。将上述二种特征输入至DNN‑CLSTM网络中进行训练得到网络模型，并采取最小均方误差(MMSE)损失函数评价指标评估模型有效性。最后，将实际含噪语音集输入至完成训练的语音增强网络模型中，预测出增强后的估计幅值和MFCC，采用逆傅立叶变换得到最终的增强语音信号。本发明具有语音的高保真性。
搜索关键词：	一种基于 dnn clstm 网络语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安邮电大学，未经西安邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202011323987.2/，转载请声明来源钻瓜专利网。

上一篇：一种Ti-Al-V-Fe合金无缝管的短流程制备方法
下一篇：一种耐高温玻璃针刺毡

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于DNN-CLSTM网络的语音增强方法在审

专利文献下载