[发明专利]用于低位速率应用的对过渡语音帧的译码无效

申请号：	200980123138.8	申请日：	2009-06-19
公开（公告）号：	CN102067212A	公开（公告）日：	2011-05-18
发明（设计）人：	阿洛科·K·古普塔;沙拉什·曼朱纳什;阿南塔帕德马纳卜汉·坎达达伊	申请（专利权）人：	高通股份有限公司
主分类号：	G10L19/12	分类号：	G10L19/12;G10L11/04
代理公司：	北京律盟知识产权代理有限责任公司 11287	代理人：	宋献涛
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于低位速率应用过渡语音译码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音信号的处理。

背景技术

通过数字技术来传输音频信号(例如，话音和音乐)特别在长途电话、例如IP话音(还称为VoIP，其中IP表示因特网协议)的包交换电话，和例如蜂窝式电话的数字无线电电话中已变得普遍。此激增已产生对减小用以经由传输信道传送话音通信的信息量同时维持经重建语音的感知质量的兴趣。举例来说，需要最佳地利用可用无线系统带宽。有效使用系统带宽的一种方式为使用信号压缩技术。对于载运语音信号的无线系统来说，出于此目的通常使用语音压缩(或“语音译码”)技术。

经配置以通过提取与人类语音产生模型有关的参数来压缩语音的装置通常称为声码器、“音频译码器”或“语音译码器”。(本文中互换地使用这三个术语。)语音译码器通常包括编码器和解码器。编码器通常将传入的语音信号(表示音频信息的数字信号)划分成称为“帧”的时间区段，分析每一帧以提取某些相关参数，且将所述参数量化成经编码帧。经编码帧经由传输信道(即，有线或无线网络连接)传输到包括解码器的接收器。解码器接收并处理经编码帧、将其解量化以产生参数，且使用经解量化的参数来重新创建语音帧。

在典型通话中，每一说话者在约百分之六十的时间中不发声。语音编码器通常经配置以区别语音信号的含有语音的帧(“有效帧”)与语音信号的仅含有静默或背景噪声的帧(“无效帧”)。此编码器可经配置以使用不同译码模式和/或速率来编码有效与无效帧。举例来说，语音编码器通常经配置以与编码有效帧相比使用较少位来编码无效帧。语音译码器可对于无效帧使用较低位速率以支持在少许或甚至无察觉到的质量损失的情况下以较低平均位速率来传送语音信号。

用以编码有效帧的位速率的实例包括每帧171个位、每帧80个位和每帧40个位。用以编码无效帧的位速率的实例包括每帧16个位。在蜂窝式电话系统(尤其为依照如由电信工业协会(Arlington，VA)发布的临时标准(IS)-95或类似工业标准的系统)的情形下，这四个位速率还分别称作“全速率”、“半速率”、“四分之一速率”和“八分之一速率”。

发明内容

一种根据一个配置的编码语音信号的帧的方法包括编码语音信号的第一帧以作为第一经编码帧，和编码语音信号的第二帧以作为第二经编码帧。在此方法中，编码第一帧包括：基于来自第一帧的至少一个音调脉冲的信息而选择多个时域音调脉冲形状中的一者；计算第一帧的终端音调脉冲的位置；以及估计第一帧的音调周期。在此方法中，编码第二帧包括：计算在第二帧的音调脉冲形状与第一帧的音调脉冲形状之间的音调脉冲形状差别；以及计算在第二帧的音调周期与第一帧的音调周期之间的音调周期差别。在此方法中，第一经编码帧包括选定的时域音调脉冲形状、所计算位置和所估计音调周期中的每一者的表示。在此方法中，第二经编码帧包括音调脉冲形状差别和音调周期差别中的每一者的表示，且在语音信号中第二帧在所述第一帧之后。

根据一个配置的解码语音信号的激励信号的方法包括：解码第一经编码帧的一部分以获得第一激励信号；以及解码第二经编码帧的一部分以获得第二激励信号。在此方法中，第一经编码帧的所述部分包括时域音调脉冲形状、音调峰值位置和音调周期中的每一者的表示。在此方法中，第二经编码帧的所述部分包括音调脉冲形状差别和音调周期差别中的每一者的表示。在此方法中，解码第一经编码帧的一部分包括：根据所述音调峰值位置将所述时域音调脉冲形状的第一副本布置于所述第一激励信号内；以及根据所述音调峰值位置和所述音调周期将所述时域音调脉冲形状的第二副本布置于所述第一激励信号内。在此方法中，解码第二经编码帧的一部分包括：基于所述时域音调脉冲形状和所述音调脉冲形状差别而计算第二音调脉冲形状；基于所述音调周期和所述音调周期差别而计算第二音调周期；以及根据所述音调峰值位置和所述第二音调周期将所述第二音调脉冲形状的多个副本布置于所述第二激励信号内。

一种根据一个配置的检测语音信号的帧的音调峰值的方法包括：检测所述帧的第一音调峰值；从所述帧的第一搜索窗内的多个样本中选择候选样本；从多个距离中选择候选距离，所述多个距离中的每一者对应于所述帧的第二搜索窗内的不同样本。此方法包括选择(A)所述候选样本和(B)对应于所述候选距离的所述样本中的一者作为所述帧的第二音调峰值。在此方法中，所述多个距离中的每一者是A)对应样本与B)第一音调峰值之间的距离。

本文中还明确预期并揭示经配置以执行这些方法的设备和其它装置以及具有在通过处理器执行时致使处理器执行此些方法的要素的指令的计算机可读媒体。

附图说明

图1展示语音信号的有声区段的实例。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于高通股份有限公司，未经高通股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200980123138.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于低位速率应用的对过渡语音帧的译码无效

专利文献下载