[发明专利]一种基于MEE优化准则的深度神经网络语音增强模型在审
申请号: | 201711384226.6 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108133702A | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 周翊;黄张翼;舒晓峰;孙旭光 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L21/0208;G10L25/03;G10L25/30;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音增强 纯净语音 混合语音 神经网络 特征提取 训练阶段 优化准则 降噪 语音 非平稳噪声 人工智能 解码 波形重构 实际问题 网络输出 训练模型 语音文件 普适性 输出层 输入层 信噪比 构建 隐层 相加 噪声 网络 | ||
1.一种基于MEE优化准则的深度神经网络语音增强模型,其特征在于:该模型包括输入层、隐层和输出层;所述隐层层数为3,节点数为1024;
该模型分为训练阶段和增强阶段;
所述训练阶段:将纯净语音和多种类噪声两两相加构建不同信噪比下的混合带噪语音,对混合语音进行特征提取,输入到深度神经网络(Deep Neural Network,,DNN)进行训练;
所述增强阶段:对待测混合语音进行相同特征提取,输入到已经训练好的DNN进行解码,DNN输出对纯净语音的特征的估计,再进行波形重构,得到降噪后的语音文件。
2.如权利要求1所述的一种基于MEE优化准则的深度神经网络语音增强模型,其特征在于:在DNN训练阶段,用误差逆传播(error BackPropagation,BP)算法更新DNN权值;输入通过各个隐层获得的激励响应,隐层中上一层的输出是下一层的输入,直到最后一层获得预测值;预测值和参考信号的差异需要反向传播的错误,根据这个错误来调节DNN的各个权值和偏置。
3.如权利要求1所述的一种基于MEE优化准则的深度神经网络语音增强模型,其特征在于:定义最小误差熵MEE代价函数的最后实际表达为:
其中,n表示隐层的节点数;e(i)和e(u)分别表示第i个神经元和第u个神经元的错误;错误e=target-output,表示经DNN训练后输出的对纯净语音对数功率谱的估计值与参考值的差异;h表示核宽度,即平滑参数;高斯核函数K表示为:
为了使用BP算法,需要得到梯度Δω的解析表达式;因为(1)式函数是单调递增的,最小化它的操作数,操作数表示为:
其中,yk=output;
当i=k时,的导数为:
当u=k时,的导数为:
综合(3)、(4)、(5)式可得:
化简整理(6)式可得:
其中,Wkj表示第j层第k个神经元的权值,net(j)表示为第j层第k个神经元的输入,f(·)是神经元的激活函数,f′(·)代表f(·)的导数;
综上,给定学习率η,用MEE作为代价函数的BP算法中的权值,更新(7)式可得:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711384226.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人语音交互的系统与方法
- 下一篇:一种手机控制系统