[发明专利]一种语音线性预测模型的非线性量化方法有效
申请号: | 201310538591.3 | 申请日: | 2013-11-05 |
公开(公告)号: | CN103632673A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 马占宇;肖波;司中威;郭军 | 申请(专利权)人: | 无锡北邮感知技术产业研究院有限公司 |
主分类号: | G10L19/035 | 分类号: | G10L19/035;G10L19/07 |
代理公司: | 北京中恒高博知识产权代理有限公司 11249 | 代理人: | 宋敏 |
地址: | 214000 江苏省无锡市新区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 线性 预测 模型 非线性 量化 方法 | ||
技术领域
本发明涉及语音编码技术领域,具体地,涉及一种语音线性预测模型的非线性量化方法。
背景技术
随着互联网技术的深入发展,语音通信技术得到了长足的进步,传输的语音信号已经由窄带信号传播演进到了宽带信号传播。伴随着多媒体应用的不断开发与推广,人们对于在语音通信技术中语音传输质量和实时性的要求越来越高,因此,研究高效可靠的语音通信算法,具有迫切的社会需求。
语音通信中要解决的首要问题是语音的编码。经过数十年的发展,语音编码技术大致可以分为三种方式:波形编码技术、基于参数模型的编码技术和混合编码技术。波形编码技术针对语音波形直接进行量化和传输,不基于声学模型。基于参数模型的编码技术将语音通过线性预测模型分析后,分别传输线性预测模型,边信息和语音能量信息。混合编码技术是上述两者的结合。一般来说,基于参数模型的编码技术是应用较为广泛,性能比较可靠的一类编码技术,其核心在于如何有效可靠的传输线性预测模型,即如何实现模型的有效量化和编码。
线性预测编码技术是语音编码处理中的核心技术。在语音线性预测编码模型的研究中,线谱频率参数是使用较多的一种表示方式,原因在于其频谱敏感区域的分布较为平均,即量化误差对于每一个频段的影响基本一样。早期的线谱频率参数量化研究集中在基于数据的量化器设计上,即获取大量的线谱频率参数并通过Lloyd-Max算法实现矢量量化器。由于数据量有限,此矢量量化器存在严重的过拟合问题。此外,由于矢量量化器的训练时间和量化中心匹配时间随着量化级数的增加呈指数增长,在高速率传输的时候,时间开销较大,复杂度较高。近年来,基于概率密度分布的优化量化吸引了学术界和工业界的大量关注,其原因在于这种方法可以在获得线谱频率参数概率密度分布函数的基础上计算出量化器的量化中心,从而避免了由于数据量有限带来的过拟合问题和训练时间过长的问题。此外,通过统计模型,可以将线谱频率参数之间的相关性去除,得到一组互相独立的参数。在去除记忆优势的基础上,标量量化器可以取代矢量量化其,使得量化中心匹配时间进一步缩短。
然而,传统的基于概率密度分布的优化量化方法主要基于高斯统计模型构建,无法很好的描述线谱频率参数的有界、有序的特性。针对这一问题,有学者提出了有界的高斯混合模型来描述线谱频率参数的上述特性,虽然取得了一些量化性能上的提高,却带来了时间复杂度太高的负面影响,总体效果不尽如人意。
在实现本发明的过程中,发明人发现现有技术中至少存在时间复杂度高和使用效果差等缺陷。
发明内容
本发明的目的在于,针对上述问题,提出一种语音线性预测模型的非线性量化方法,以实现时间复杂度低和使用效果好的优点。
为实现上述目的,本发明采用的技术方案是:一种语音线性预测模型的非线性量化方法,包括:
a、线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;
b、非线性去相关步骤:根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关;
c、计算边际概率分布步骤:利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布;
d、标量量化器设计步骤:根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器。
进一步地,在步骤a之前,还包括:
线性预测模型的线谱频率参数提取步骤:将线性预测模型通过Chebyshev多项式求根法转化为线谱频率参数。
进一步地,在步骤d之后,还包括:
优化的顺序量化步骤:对变换后的参数实现优化的顺序量化方式,达到控制差错传播的目的。
进一步地,所述对变换后的参数实现优化的顺序量化方式的操作,具体包括:
将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结合,形成优化的顺序量化方法,实现有效的差错控制。
进一步地,所述将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结合,形成优化的顺序量化方法,实现有效的差错控制的操作,具体包括:
1)输入:
a) 维线谱频率参数差值向量;
b)如步骤5得到的针对每一个的标量量化器;
2)初始化:
a)计数器;
b)维目标向量;
3)执行次循环,其中第步循环操作:
a)当时:
i.取出向量中的第一个元素,将其通过步骤5中描述的标量量化器量化,得到元素放入向量中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡北邮感知技术产业研究院有限公司,未经无锡北邮感知技术产业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310538591.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:盲人五子棋棋具
- 下一篇:一种含钛介孔生物玻璃的制备方法