[发明专利]训练神经网络的方法及系统在审

专利信息
申请号: 201911114742.6 申请日: 2019-11-14
公开(公告)号: CN111435462A 公开(公告)日: 2020-07-21
发明(设计)人: 金宰永;李正元;莫斯塔法·伊尔-哈米 申请(专利权)人: 三星电子株式会社
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 北京汇知杰知识产权代理有限公司 11587 代理人: 李洁;董江虹
地址: 韩国京畿道水*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练 神经网络 方法 系统
【说明书】:

本文中公开一种用于训练神经网络的方法及系统。根据一个实施例,所述方法包括:接收有噪信号;产生经去噪输出信号;基于所述经去噪输出信号来确定信号失真比(SDR)损失函数;基于所述经去噪输出信号来确定感知语音质量评估(PESQ)损失函数;以及基于所述感知语音质量评估损失函数及所述信号失真比损失函数来优化总损失函数。

[优先权]

本申请是基于在2019年1月11日在美国专利商标局提出申请且被授予序列号62/791,421的美国临时专利申请且主张所述美国临时专利申请的优先权,所述美国临时专利申请的全部内容并入本申请供参考。

技术领域

本公开总体上涉及信号处理。具体来说,本公开涉及信号失真比(SDR)及感知语音质量评估(PESQ)优化。

背景技术

最近,基于深度神经网络的监督学习(supervised learning)在语音增强(speechenhancement)方面实现了实质性的改进。与典型统计方式的主要差异在于,没有必要对信号模型进行预先假设。举例来说,维纳滤波器(Wiener filter)通常假设语音或噪声模型的高斯分布(Gaussian distribution),这在真实环境中常常是不正确的。相反的,神经网络仅通过参照从有噪语音(noisy speech)到训练数据的干净语音(clean speech)的映射来学习语音去噪。

频谱掩蔽估计(spectra mask estimation)包括预测时间-频率频谱掩蔽(time-frequency spectra mask)(即,干净频谱与有噪频谱之间的比)。先前已提出理想二进制掩蔽(ideal binary mask,IBM)来用于训练标签(label),其中IBM根据对应的信噪比(signalto noise ratio,SNR)而为一或零。理想比掩蔽(ideal ratio mask,IRM)及理想量值掩蔽(ideal magnitude mask,IAM)提供软掩蔽标签(soft mask label)来克服IBM的粗略映射。由于更好的标签分辨率,这两种方法均相对于IBM表现出改进。另外,先前提出了将干净相位及有噪相位考虑在内的相位敏感掩蔽(phase sensitive mask,PSM)。PSM不补偿有噪相位,但通过参考干净相位与有噪相位比,PSM为掩蔽估计提供更好的频谱振幅标签(spectraamplitude label)。

然而,这种方式具有两个关键问题:度量失配(metric mismatch)及频谱失配。频谱掩蔽估计通常使干净频谱振幅与所估计的频谱振幅之间的均方误差(mean squareerror,MSE)最小化,由于度量失配,这在使信号失真比(signal distortion ratio,SDR)或感知语音质量评估(perceptual evaluation of speech quality,PESQ)最大化方面不是最优的。举例来说,常常观察到,尽管频谱均方误差减小,但SDR或PESQ经常劣化。第二个频谱失配问题源自频谱域的估计。一般来说,由于短时傅里叶变换(short-time Fouriertransform,STFT)运算及短时傅里叶逆变换(inverse short-time Fourier transform,ISTFT)运算,频谱信号的任何任意修改均无法完全恢复,这也被称为STFT不一致。举例来说,经去噪频谱一般来说不与所恢复的波形的频谱振幅匹配。因此,经去噪频谱振幅无法完全反映到重构输出(reconstructed output),这可能导致实质性的性能损失。

发明内容

根据一个实施例,一种训练神经网络的方法包括:接收有噪信号;产生经去噪输出信号;基于所述经去噪输出信号来确定信号失真比(SDR)损失函数;基于所述经去噪输出信号来确定感知语音质量评估(PESQ)损失函数;以及基于所述PESQ损失函数及所述SDR损失函数来优化总损失函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911114742.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top