[发明专利]弯曲谱和精细估计音频编码有效
申请号: | 201110415397.7 | 申请日: | 2011-12-02 |
公开(公告)号: | CN102568484A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | M·L·塞尔泽;J·G·德罗珀;H·S·玛尔瓦;A·阿塞罗;樊星 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L15/00 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弯曲 精细 估计 音频 编码 | ||
技术领域
本发明涉及音频编解码。
背景技术
诸如在移动电话和IP语音(VOIP)网络中所使用的那些典型的语音编解码器使用设计来改善人类听者的感知质量而非语音识别性能的方案来对原始的语音信号编码。相反,语音识别系统通常使用设计来改善语音识别性能的方案来对诸如弯曲频谱估计表示(此处也称为弯曲谱估计)之类的语音识别特征进行编码。一些方案尝试使用已编码语音识别特征来构造音频信号,而一些方案尝试使用已编码的语音编解码器特征来进行语音识别。
发明内容
先前尝试使用已编码语音识别特征来构造音频信号仅取得了有限的成功,导致所构造的音频信号并非原始音频信号的接近表示。类似地,先前尝试使用已编码的语音编解码器特征来用于语音识别也取得了有限的成功。此处所描述的工具和技术可包括使用原始音频信号的弯曲谱估计以对原始信号的精细特征的精细估计进行编码。弯曲谱估计的表示可用于语音识别,并且还可与精细估计的表示一起被用于重构表示原始音频信号的重构音频信号。
如此处所使用的,原始音频信号或原始语音信号是用于编码弯曲谱估计表示的音频信号。原始信号可以是未经处理的音频信号,或者采用多种方式中的一种或多种进行预处理后的音频信号。弯曲谱估计是音频信号的频域估计,该音频信号通过改变由频谱表示的频率组范围而被弯曲。平滑估计是提供关于对应的音频信号的高级(或粗略)细节的经平滑的估计。精细估计是原始音频信号的波形的精细细节的估计,其中精细细节比用于编码精细估计的平滑估计中所提供的细节更精细。精细估计不仅仅是诸如基音信息——其提供了与音频波形的特征有关的一些细节——之类的信息,而且实际上并不估计波形的精细细节。重构的音频信号是从原始音频信号的估计中构造的信号,因而该重构的音频信号表示原始音频信号的近似。
在一实施例中,本发明的工具和技术可包括对来自原始音频信号的弯曲频谱估计的表示进行编码。该编码可基于弯曲频谱并可包括动态范围缩减操作。原始音频信号的平滑估计的表示可使用弯曲频谱估计表示来生成。此外,原始音频信号的精细细节的精细估计表示可使用平滑估计的表示来编码。
在本发明的工具和技术的另一实施例中,原始音频信号的弯曲频谱估计的表示可以被解码。原始音频信号的精细估计的表示也可以被解码。可将弯曲频谱估计的表示传递至语音识别引擎。此外,可使用弯曲频谱估计的表示和精细估计的表示来重构表示原始音频信号的音频信号。重构可包括扩展弯曲频谱估计的表示的动态范围。
提供本发明内容是为了以简化的形式介绍一些概念。这些概念将在以下具体实施方式中进一步描述。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。类似地,本发明不限于解决在背景技术、具体实施方式、或附图中讨论的特定技术、工具、环境、缺点、或优点的实现。
附图说明
图1是其中可实现所描述的各实施例中的一个或多个实施例的合适的计算环境的框图。
图2是音频编码系统的示意图。
图3是语音识别系统的示意图。
图4是用于弯曲谱和精细估计音频编码的技术的流程图。
图5是用于弯曲谱和精细估计音频编码的另一技术的流程图。
图6是用于弯曲谱和精细估计音频编码的又一技术的流程图。
具体实施方式
此处所描述的实施例涉及用于音频特征的经改进的编码/解码的技术和工具,诸如可用在语音识别中以及也可用在音频信号重构中的特征的经改进的编码/解码。这样的改善可源于分开或组合地使用各种技术和工具。
这样的技术和工具可以包括使用弯曲谱估计——其传统上已被用于语音识别——以对原始音频信号的精细估计进行编码。可将弯曲谱估计的表示和精细估计的表示发送至语音识别系统并将其用于语音识别以及重构原始音频信号的表示。例如,可将弯曲谱估计表示传递至语音识别引擎。此外,弯曲谱估计表示可与精细估计表示一起使用以重构音频信号的表示。例如,弯曲谱估计表示可用于生成平滑估计,其可与精细估计组合以对表示原始音频信号的重构音频信号进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110415397.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子通信优先分配
- 下一篇:去除测序文库中的载体片段的方法