[发明专利]语音编码有效
申请号: | 201080010209.6 | 申请日: | 2010-01-05 |
公开(公告)号: | CN102341848A | 公开(公告)日: | 2012-02-01 |
发明(设计)人: | 科恩·贝尔纳德·福斯 | 申请(专利权)人: | 斯凯普有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京金信立方知识产权代理有限公司 11225 | 代理人: | 黄威;徐爱萍 |
地址: | 爱尔兰*** | 国省代码: | 爱尔兰;IE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 编码 | ||
技术领域
本发明涉及用于经由传输介质诸如借助于有线连接上的电子信号或者无线连接上的电磁信号进行传输的语音的编码。
背景技术
在图1a中示意性地示出了语音的声源-滤波器模型。如所示,语音能够被建模为包括从声源102经过时变滤波器104的信号。声源信号表示声带的直接振动,而滤波器表示由咽喉、口部和舌头的形状形成的声道的声效。滤波器的作用是改变声源信号的频率分布从而增强或者削弱特定的频率。语音编码通过使用声源-滤波器模型的参数表示语音来工作而不是试图直接表示为实际的波形。
如图1b中所示意性地示出的,编码的信号将被分成多个帧106,其中每个帧包括多个子帧108。例如,语音可以16kHz被采样并且以20ms的帧被处理,其中一些处理以5ms的子帧进行(每帧有4个子帧)。每个帧包括标记107,帧通过标记107根据其各自的类型被分类。因此每个帧至少被分为“浊音的”或者“清音的”,并且清音帧不同于浊音帧地被编码。因此每个子帧108包括一组表示在该子帧中的语音声音的声源-滤波器模型的参数。
对于浊音声音(诸如元音声),声源信号具有对应于感知到的声音的基音的一定程度的长期周期性。在该情形中,声源信号能够被建模为包括准周期性信号,其中每个周期包括一系列不同幅度的脉冲。源信号被称为是“准”周期性的,原因在于:在至少一个子帧的时标上,可能需要使其具有大致恒定的单个的、有针对性的(meaningful)周期;但是在多个子帧或帧上,信号的周期和形状则可改变。在任意给定点的大致周期可以被称为基音滞后。在图2a中示意性地示出了被建模的声源信号202的示例,其中逐渐变化的周期P1、P2、P3等各包括四个脉冲,脉冲可以从一个周期到下一个周期在形状和幅度上逐渐变化。
根据诸如使用线性预测编码(LPC)的算法的多种语音编码算法,使用短期滤波器来将语音信号分成两个单独的分量:(i)表示时变滤波器104的作用的信号;和(ii)去除了滤波器104的作用的剩余信号,其表示声源信号。表示滤波器104的作用的信号可以被称为频谱包络线信号(spectral envelope signal),并且典型地包括一系列描述在各个阶段的频谱包络线的LPC参数组。图2b示出了随时间变化的一连串频谱包络线2041、2042、2043等的示意性示例。如图2a示意性所示,当去除了变化的频谱包络线时,仅表示声源的剩余信号可以被称为LPC残差信号。
频谱包络线信号和声源信号各自被单独编码以进行传输。在图示出的示例中,各个子帧106将包含:(i)表示频谱包络线204的一组参数;和(ii)表示声源信号202的脉冲的一组参数。
在图示出的示例中,各个子帧106将包含:(i)一组量化的表示频谱包络线的LPC参数;(ii)(a)与声源信号中的基音周期之间的相关性有关的量化的LTP矢量,和(ii)(b)表示去除了周期间相关性和频谱包络线的作用的声源信号的量化的LTP残差信号。
残差信号包括在原始输入的语音信号中存在的信息,该信息未被量化的LPC参数和LTP矢量所表示。此信息必须与LPC参数和LTP参数一起进行编码和发送以便允许编码的语音信号在解码器中被准确地合成。为了降低传输编码的语音信号所需的比特率,优选的是使残差信号的能量最小化,因此使对残差信号进行编码所需的比特率最小化。
本发明的一些实施例的目的在于解决或者至少缓解一些现有技术中的上述问题。
发明内容
根据本发明的一个方案,提供了一种根据声源-滤波器模型对语音信号进行编码从而将语音建模为包括由时变滤波器滤波的声源信号的方法,所述方法包括:接收包括连续帧的语音信号;对于所述语音信号的多个帧中的每个:使预定的噪声信号与输入的语音信号相加以生成模拟信号;基于模拟信号帧来确定线性预测编码系数;以及基于语音输入信号和所述线性预测编码系数来确定线性预测编码残差信号;以及基于所述线性预测编码系数和所述线性预测编码残差信号,形成表示所述语音信号的编码信号。
在实施例中,所述方法可进一步包括基于所述线性预测编码残差信号来生成量化的残差信号。
生成量化的残差信号可以进一步生成相关的量化噪声信号,并且所述预定的噪声信号包括白噪声,所述白噪声具有的方差(variance)可等于量化噪声的方差。
可通过使白噪声信号与量化增益值相结合来生成所述预定的噪声信号。可以在噪声成形分析中生成所述量化增益值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯凯普有限公司,未经斯凯普有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080010209.6/2.html,转载请声明来源钻瓜专利网。