[发明专利]利用受限非负矩阵分解对声学信号去噪有效
申请号: | 200810174860.1 | 申请日: | 2008-11-10 |
公开(公告)号: | CN101441872A | 公开(公告)日: | 2009-05-27 |
发明(设计)人: | 凯文·W·威尔森;阿贾伊·迪瓦卡兰;比克沙·罗摩克里希纳;帕里斯·斯马拉格迪斯 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李 辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 受限 矩阵 分解 声学 信号 | ||
1.一种对混合信号(104,Vmix)进行去噪的方法,其中所述混合信号(104,Vmix)包括声学信号(101,)和噪声信号(102,),该方法包括以下步骤:
对所述混合信号(104,Vmix)应用受限非负矩阵分解,其中所述非负矩阵分解受到去噪模型(103)的限制,其中所述去噪模型(103)包括训练声学信号(101,)和训练噪声信号(102,)二者的训练基矩阵(211-212,WT)、以及这些训练基矩阵(211-212,WT)的权重(213-214,HT;302,Hall)的统计量(221-222),并且其中所述应用产生了所述混合信号(104,Vmix)的所述声学信号(101,)的基矩阵(211)的权重;以及
求取所述声学信号(101,)的所述基矩阵(211)的所述权重(213-214,HT;302,Hall)与所述训练声学信号(101,)和所述训练噪声信号(102,)二者的所述训练基矩阵(211-212,WT)的乘积,以重构所述声学信号(101,)。
2.根据权利要求1所述的方法,其中所述噪声信号(102,)是非平稳的。
3.根据权利要求1所述的方法,其中所述统计量(221-222)包括所述训练基矩阵(211-212,WT)的所述权重(213-214,HT;302,Hall)的均值(μspeech)和方差(Λspeech221)。
4.根据权利要求1所述的方法,其中所述声学信号(101,)是语音。
5.根据权利要求1所述的方法,其中所述去噪是实时进行的。
6.根据权利要求1所述的方法,其中所述去噪模型(103)存储在存储器中。
7.根据权利要求1所述的方法,其中所有信号是呈数字化声谱图的形式。
8.根据权利要求1所述的方法,该方法进一步包括以下步骤:
使得代表所述训练声学信号(101,)的矩阵Vspeech与代表所述训练基矩阵(211-212,WT)的矩阵Wspeech以及代表所述训练声学信号(101,)的所述权重的矩阵Hspeech之间的Kullback-Leibler散度最小化;以及
使得代表所述训练噪声信号(102,)的矩阵Vnoise与代表训练噪声矩阵的矩阵Wnoise以及代表所述训练噪声信号(102,)的所述权重的矩阵Hnoise之间的Kullback-Leibler散度最小化。
9.根据权利要求1所述的方法,其中所述统计量(221-222)是在对数域中确定的。
10.一种对混合信号(104,Vmix)进行去噪的系统,其中所述混合信号(104,Vmix)包括声学信号(101,)和噪声信号(102,),该系统包括:
用于对所述混合信号(104,Vmix)应用受限非负矩阵分解(NMF)的装置,其中所述非负矩阵分解受到去噪模型(103)的限制,其中所述去噪模型(103)包括训练声学信号(101,)和训练噪声信号(102,)二者的训练基矩阵(211-212,WT)、以及这些训练基矩阵(211-212,WT)的权重(213-214,HT;302,Hall)的统计量(221-222),并且其中所述应用产生了所述混合信号(104,Vmix)的所述声学信号(101,)的基矩阵(211)的权重;以及
用于求取乘积以重构所述声学信号(101,)的装置,其中所述乘积是所述声学信号(101,)的所述基矩阵(211)的所述权重与所述训练声学信号(101,)和所述训练噪声信号(102,)二者的所述训练基矩阵(211-212,WT)的乘积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810174860.1/1.html,转载请声明来源钻瓜专利网。