[发明专利]用于建模语音频谱的系统和方法无效

专利信息
申请号: 200780041119.1 申请日: 2007-09-26
公开(公告)号: CN101536087A 公开(公告)日: 2009-09-16
发明(设计)人: J·尼尔米南;S·伊玛南 申请(专利权)人: 诺基亚公司
主分类号: G10L19/08 分类号: G10L19/08;G10L19/02;G10L19/06
代理公司: 北京市金杜律师事务所 代理人: 吴立明
地址: 芬兰*** 国省代码: 芬兰;FI
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 建模 语音 频谱 系统 方法
【说明书】:

技术领域

发明总体涉及语音处理。更特别地,本发明涉及诸如语音编 码、话音转换和文本到语音合成的语音处理应用。

背景技术

本部分意在提供在权利要求书中陈述的本发明的背景或上下 文。本文的描述可包括将被贯彻的概念,但前面被表达和贯彻的内 容并非是必须的。因而,除非在本文指出,在此部分所描述的并非 是在该申请中的说明书和权利要求书的现有技术,以及并非通过包 含于此部分内而承认其为现有技术。

许多语音模型依赖于基于线性预测(LP)的方法,其中使用 LP系数对声道(vocal tract)进行建模。继而,使用进一步的技术对 激励信号(即,LP残差(residual))建模。下面是一些传统技术。 第一,可将激励建模为周期性脉冲(在话音语音(voiced speech)期 间)或者噪声(在非话音语音(unvoiced speech)期间)。然而,由 于话音/非话音硬决策,限制了可获得的质量。第二,可使用激励频 谱对激励建模,其将在时变的截止频率之下的激励频谱认为是话音 的,而将在该频率之上的激励频谱认为是非话音的。这种频带切分 方法能够在语音信号的许多部分上令人满意地执行,但是问题依然 出现,尤其是在具有混合的声音和噪声语音的频谱的情况下。第三, 可使用多带激励(MBE,multiband excitation)模型。在此模型中, 频谱可包括若干话音的频带和非话音的频带(多达谐波的数量)。 对于每个频带执行单独的话音/非话音决策。尽管在一些情况下是相 当可接受的,但是MBE模型的性能关于对多个频带的话音/非话音 硬决策依然具有受限的质量。第四,在波形内插(WI,waveform interpolation)语音编码中,将激励建模为慢渐变波形(SEW,slowly evolving waveform)和快渐变波形(REW,rapidly evolving waveform)。SEW对应于话音的贡献,而REW代表非话音的分布。 不幸的是,由于高复杂度和对于获得SEW和REW的完美分割不总 是可行,此模型受到损害。

因此,希望提供一种改进的用于建模语音频谱的系统和方法, 以解决上面提出的许多问题。

发明内容

本发明的多种实施方式提供了用于以话音的和非话音的贡献 二者能够共存于某频率的方式来建模语音的系统和方法。为将复杂 度保持在适中的程度,使用三组频谱带(或者高达三种不同类型的 频带)。在一个特定实施方式中,最低频带或频带组完全是话音的, 中间频带或频带组包含话音的和非话音的贡献两者,而最高频带或 频带组是完全非话音的。此种实现在需要的场合提供了高的建模精 度,并且也以低计算负载支持较简单的情况。可使用本发明的实施 方式用于语音编码和其它语音处理应用,诸如文本到语音合成和话 音转换。

本发明的多种实施方式在语音建模,尤其在较弱的话音语音的 情况下,提供了高精度,与此同时,仅承受适中的计算负载。多种 实施方式相对于传统装置也提供了在精度和复杂度之间的改进的平 衡。

当结合附图而考虑时,从下文的详细描述中,本发明的这些和 其它优点和特征,连同其操作的方式和组织将变得明显,其中贯穿 下文描述的若干附图,相同的单元具有相同的数字。

附图说明

图1是示出了可以如何实现多种实施方式的流程图;

图2是可在本发明的实现中使用的移动电话的透视图;以及

图3是对图2移动电话的电话电路的示意性展现。

具体实施方式

本发明的多种实施方式提供了用于以话音的和非话音的贡献 二者能够共存于某频率的方式来建模语音的系统和方法。为将复杂 度保持在适中的程度,使用三个频谱带集合(或者高达三种不同类 型的频带)。在一个特定实施方式中,最低频带或频带组完全是话 音的,中间频带或频带组包含话音的和非话音的贡献两者,而最高 频带或频带组是完全非话音的。此种实现在需要的场合提供了高的 建模精度,并且也以低计算负载支持较简单的情况。可使用本发明 的实施方式用于语音编码和其它语音处理应用,诸如文本到语音合 成和语音转换。

本发明的多种实施方式在语音建模,尤其在较弱的话音语音的 情况下,提供了高精度,与此同时,仅承受适中的计算负载。多种 实施方式相对于传统装置也提供了在精度和复杂度之间的改进的平 衡。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200780041119.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top