[发明专利]用于处理声音信号的方法有效
申请号: | 201480040398.X | 申请日: | 2014-07-04 |
公开(公告)号: | CN105393305B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | J·勒鲁克斯;渡部晋治;J·R·赫尔歇 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 声音 信号 方法 | ||
一种处理声音信号的方法,该声音信号是目标信号和干扰信号的混合物,该方法首先通过一组增强过程增强声音信号以产生一组初始增强信号。然后,对该声音信号和该组初始增强信号应用集成学习过程以产生该声音信号的特征。
技术领域
本发明总体上涉及语音处理,并且更具体地涉及增强包括干扰的语音信号。
背景技术
语音增强
语音增强方法部分地以改善语音识别为目的尝试改善已被噪声或其它干扰处理劣化的语音的质量和明了度。由于存在许多类型的干扰,因此这是困难的问题。通常,语音混合有来自听觉上杂乱的环境的多个竞争声源的噪声背景。更为复杂的是,在实时应用中对计算资源和延迟的操作约束常常使得使用可以代表和适应于许多不同的干扰的复杂模型不可能。因为简单方法很难适应各种条件,所以通常做出作为基础的语音和干扰的统计特性的一些假设。
已知许多不同的增强方法,每个方法都具有对语音和干扰的性质的不同的明确或隐含的假设。然而,这些方法中的许多改善了信号中的某些部分,但同时常常劣化了其它部分。
集成学习(ensemble learning)
集成学习方法通常将有限的一组替代模型组合,并且利用由每个模型所造成的误差的独立性来减小估计差异,并从而减小误差率。这些方法在从简单的投票过程(其中,由每个模型推定的量被平均)到堆叠(其中二次模型被训练以按适合于训练数据的方式来执行该组合)变动。作为优点,投票方法可以在不考虑实时条件下而被应用。而堆叠方法可以学习更复杂的组合功能,从而可能得到更好的性能。
集成方法已经在自动语音识别(ASR)中被广泛使用,以经由诸如识别器输出投票误差还原(ROVER)的投票过程来融合不同识别器的语音识别假设。该ROVER系统是后识别处理,其将由多个ASR系统生成的输出建模为独立的知识源,该知识源可以被组合并且用于生成具有降低的错误率的输出。
尤其是,相关的集成ASR方法根据前端ASR处理而不同。集成ASR方法的主要优点是它们可以使用多种现有的方法来提高性能。
发明内容
本发明的实施方式提供一种用于处理声音信号的方法。该方法是基于这样的认识:许多方法具有不同的优点并且由于不同的缺陷受到损害。本发明将多个声音信号增强过程的优势组合,并将增强问题制定为集成学习框架。增强过程的组合可以大幅改善增强。
具体地,该方法由增强过程的集成来增强声音信号以产生初始增强信号,来处理作为目标信号和干扰信号的混合物的声音(语音)信号。然后由集成学习方法将增强信号组合以确定声音信号的特征。具体情况是特征是增强声音(语音)信号。
做到这一点的一种可能方式是,在共同域中构造每个增强过程的输出的表示,组合这些表示使得所组合的表示尽可能接近于与纯净目标信号相关联的表示。
具体地,该方法首先由一组增强过程来增强声音信号以产生一组初始增强信号,来处理作为目标信号和干扰信号的混合物的声音信号。然后,向该声音信号和该一组初始增强信号应用集成学习过程以产生该声音信号的特征。
附图说明
图1是根据本发明的实施方式的用于处理声音信号的方法的流程图。
图2是根据本发明的实施方式的集成学习过程的流程图。
具体实施方式
方法概述
图1示出了根据我们的发明的实施方式的用于处理声音信号101的方法。在优选实施方式中,声音信号y[t]101是语音信号x[t]和从声音上复杂且嘈杂的环境104中获取的各种干扰信号n的混合物101。可以理解的是,该方法可以用于处理其它类型的声音信号,例如,声纳信号或者超声波信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480040398.X/2.html,转载请声明来源钻瓜专利网。