[发明专利]用于建模语音频谱的系统和方法无效
申请号: | 200780041119.1 | 申请日: | 2007-09-26 |
公开(公告)号: | CN101536087A | 公开(公告)日: | 2009-09-16 |
发明(设计)人: | J·尼尔米南;S·伊玛南 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | G10L19/08 | 分类号: | G10L19/08;G10L19/02;G10L19/06 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 吴立明 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 建模 语音 频谱 系统 方法 | ||
技术领域
本发明总体涉及语音处理。更特别地,本发明涉及诸如语音编 码、话音转换和文本到语音合成的语音处理应用。
背景技术
本部分意在提供在权利要求书中陈述的本发明的背景或上下 文。本文的描述可包括将被贯彻的概念,但前面被表达和贯彻的内 容并非是必须的。因而,除非在本文指出,在此部分所描述的并非 是在该申请中的说明书和权利要求书的现有技术,以及并非通过包 含于此部分内而承认其为现有技术。
许多语音模型依赖于基于线性预测(LP)的方法,其中使用 LP系数对声道(vocal tract)进行建模。继而,使用进一步的技术对 激励信号(即,LP残差(residual))建模。下面是一些传统技术。 第一,可将激励建模为周期性脉冲(在话音语音(voiced speech)期 间)或者噪声(在非话音语音(unvoiced speech)期间)。然而,由 于话音/非话音硬决策,限制了可获得的质量。第二,可使用激励频 谱对激励建模,其将在时变的截止频率之下的激励频谱认为是话音 的,而将在该频率之上的激励频谱认为是非话音的。这种频带切分 方法能够在语音信号的许多部分上令人满意地执行,但是问题依然 出现,尤其是在具有混合的声音和噪声语音的频谱的情况下。第三, 可使用多带激励(MBE,multiband excitation)模型。在此模型中, 频谱可包括若干话音的频带和非话音的频带(多达谐波的数量)。 对于每个频带执行单独的话音/非话音决策。尽管在一些情况下是相 当可接受的,但是MBE模型的性能关于对多个频带的话音/非话音 硬决策依然具有受限的质量。第四,在波形内插(WI,waveform interpolation)语音编码中,将激励建模为慢渐变波形(SEW,slowly evolving waveform)和快渐变波形(REW,rapidly evolving waveform)。SEW对应于话音的贡献,而REW代表非话音的分布。 不幸的是,由于高复杂度和对于获得SEW和REW的完美分割不总 是可行,此模型受到损害。
因此,希望提供一种改进的用于建模语音频谱的系统和方法, 以解决上面提出的许多问题。
发明内容
本发明的多种实施方式提供了用于以话音的和非话音的贡献 二者能够共存于某频率的方式来建模语音的系统和方法。为将复杂 度保持在适中的程度,使用三组频谱带(或者高达三种不同类型的 频带)。在一个特定实施方式中,最低频带或频带组完全是话音的, 中间频带或频带组包含话音的和非话音的贡献两者,而最高频带或 频带组是完全非话音的。此种实现在需要的场合提供了高的建模精 度,并且也以低计算负载支持较简单的情况。可使用本发明的实施 方式用于语音编码和其它语音处理应用,诸如文本到语音合成和话 音转换。
本发明的多种实施方式在语音建模,尤其在较弱的话音语音的 情况下,提供了高精度,与此同时,仅承受适中的计算负载。多种 实施方式相对于传统装置也提供了在精度和复杂度之间的改进的平 衡。
当结合附图而考虑时,从下文的详细描述中,本发明的这些和 其它优点和特征,连同其操作的方式和组织将变得明显,其中贯穿 下文描述的若干附图,相同的单元具有相同的数字。
附图说明
图1是示出了可以如何实现多种实施方式的流程图;
图2是可在本发明的实现中使用的移动电话的透视图;以及
图3是对图2移动电话的电话电路的示意性展现。
具体实施方式
本发明的多种实施方式提供了用于以话音的和非话音的贡献 二者能够共存于某频率的方式来建模语音的系统和方法。为将复杂 度保持在适中的程度,使用三个频谱带集合(或者高达三种不同类 型的频带)。在一个特定实施方式中,最低频带或频带组完全是话 音的,中间频带或频带组包含话音的和非话音的贡献两者,而最高 频带或频带组是完全非话音的。此种实现在需要的场合提供了高的 建模精度,并且也以低计算负载支持较简单的情况。可使用本发明 的实施方式用于语音编码和其它语音处理应用,诸如文本到语音合 成和语音转换。
本发明的多种实施方式在语音建模,尤其在较弱的话音语音的 情况下,提供了高精度,与此同时,仅承受适中的计算负载。多种 实施方式相对于传统装置也提供了在精度和复杂度之间的改进的平 衡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780041119.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:中压电路断路器
- 下一篇:预报集装箱密度的系统和方法