[发明专利]一种采用高阶线性预测系数分组矢量量化的语音编解方法有效
申请号: | 201210334612.5 | 申请日: | 2012-09-10 |
公开(公告)号: | CN102867516A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 殷福亮;陈喆;汪林;张旭 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 曲永祚;李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 采用 线性 预测 系数 分组 矢量 量化 语音 方法 | ||
技术领域
本发明涉及一种采用高阶线性预测系数分组矢量量化的语音编解方法,属于语音编码技术领域。
背景技术
基本的语音通信过程如说明书附图1所示,对语音编解码器的要求是:在保证语音质量的前提下,编码码流的比特率越低越好。采用矢量量化技术、线性预测分析技术和数据插值技术的编解码器能够很好地满足这个要求。在基于上述技术的语音编解码器中,线性预测系数的编解码过程为:在编码端,用莱文森-德宾算法算法求解线性预测系数,并转化为相应的线谱频率参数,用存储在本地的码本对线谱频率参数进行矢量量化,得到码本的索引号。这些索引号会和其它语音编码参数一起被打包成比特流,通过通信网络传送到输出端。在解码端,根据从编码器传送的索引号解码出线谱频率参数,并转化为对应的线性预测系数,最后根据线性预测系数及其它编码参数合成出语音,整个过程的原理如说明书附图2所示。
矢量量化是一种高效的数据压缩方法,如说明书附图3所示,它是将若干个标量数据组构成一个矢量,然后在矢量空间中进行整体量化。对1个N维编码端待量化矢量x,从N维码本矢量集Y={y(1),y(2),...,y(L)}中选择与x最匹配的矢量y(i),在信道中只需传输y(i)在码本Y中的索引号i即可。在解码端,根据索引号i即可找到对应矢量y(i),并作为解码结果输出。码本的设计可使用LBG算法。为了降低矢量量化所需的码本体积,分裂式矢量量化技术应运而生。分裂式矢量 量化技术是比较适合于高阶线谱频率参数量化的一种方法,分裂矢量量化的过程如图4所示。分裂式矢量量化是指将待量化矢量分为几个低维子矢量,每个子矢量分别使用不同的码本量化。计算出信号线谱频率参数后,将线谱频率参数分为T个子矢量lsf0,lsf1,...,lsfT-1,每一部分分别使用不同的码本作矢量量化,得到索引号0,1,…,T–1,由这T个索引号联合表示LSF参数。同理,在解码端由这T个索引号恢复T个子矢量lsf0,lsf1,...,lsfT-1,再合并出完整LSF参数,并进一步计算线性预测系数。说明书附图4中的矢量量化在编码端表示码本搜索,在解码端表示码本提取。同传统的矢量量化技术相比,分裂式矢量量化所需的码本体积大大减小。但其还存在两个问题:第一,从高阶线性预测系数直接计算高阶线谱频率参数,运算量很大,运算量与线性预测系数个数的平方成正比;第二,针对T个子矢量,需要分别设计T组码本,因此高阶线谱频率参数所需要的码本总量仍然很大。
在语音信号分析中,常把语音x(n)看作是一个时间序列模型的输出,x(n)可表示为:
其中,M为线性预测分析阶数。a(i),i=1,2,…,M为模型参数,也称线性预测系数。e(n)为激励信号。x(n)也可以等效为e(n)经过一个全极点滤波器(也称合成滤波器)H(z)的输出,H(z)可表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210334612.5/2.html,转载请声明来源钻瓜专利网。