[发明专利]一种基于MEE优化准则的深度神经网络语音增强模型在审

申请号：	201711384226.6	申请日：	2017-12-20
公开（公告）号：	CN108133702A	公开（公告）日：	2018-06-08
发明（设计）人：	周翊;黄张翼;舒晓峰;孙旭光	申请（专利权）人：	重庆邮电大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L21/0208;G10L25/03;G10L25/30;G06N3/08
代理公司：	北京同恒源知识产权代理有限公司 11275	代理人：	赵荣之
地址：	400065 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强纯净语音混合语音神经网络特征提取训练阶段优化准则降噪语音非平稳噪声人工智能解码波形重构实际问题网络输出训练模型语音文件普适性输出层输入层信噪比构建隐层相加噪声网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于MEE优化准则的深度神经网络语音增强模型，其特征在于：该模型包括输入层、隐层和输出层；所述隐层层数为3，节点数为1024；

该模型分为训练阶段和增强阶段；

所述训练阶段：将纯净语音和多种类噪声两两相加构建不同信噪比下的混合带噪语音，对混合语音进行特征提取，输入到深度神经网络(Deep Neural Network,，DNN)进行训练；

所述增强阶段：对待测混合语音进行相同特征提取，输入到已经训练好的DNN进行解码，DNN输出对纯净语音的特征的估计，再进行波形重构，得到降噪后的语音文件。

2.如权利要求1所述的一种基于MEE优化准则的深度神经网络语音增强模型，其特征在于：在DNN训练阶段，用误差逆传播(error BackPropagation,BP)算法更新DNN权值；输入通过各个隐层获得的激励响应，隐层中上一层的输出是下一层的输入，直到最后一层获得预测值；预测值和参考信号的差异需要反向传播的错误，根据这个错误来调节DNN的各个权值和偏置。

3.如权利要求1所述的一种基于MEE优化准则的深度神经网络语音增强模型，其特征在于：定义最小误差熵MEE代价函数的最后实际表达为：

其中，n表示隐层的节点数；e(i)和e(u)分别表示第i个神经元和第u个神经元的错误；错误e＝target-output，表示经DNN训练后输出的对纯净语音对数功率谱的估计值与参考值的差异；h表示核宽度，即平滑参数；高斯核函数K表示为：

为了使用BP算法，需要得到梯度Δω的解析表达式；因为(1)式函数是单调递增的，最小化它的操作数，操作数表示为：

其中，y_k＝output；

当i＝k时，的导数为：

当u＝k时，的导数为：

综合(3)、(4)、(5)式可得：

化简整理(6)式可得：

其中，W_kj表示第j层第k个神经元的权值，net(j)表示为第j层第k个神经元的输入，f(·)是神经元的激活函数，f′(·)代表f(·)的导数；

综上，给定学习率η，用MEE作为代价函数的BP算法中的权值，更新(7)式可得：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载