[发明专利]一种语音线性预测编码模型的缺失值非线性估算方法有效
申请号: | 201410054042.3 | 申请日: | 2014-02-18 |
公开(公告)号: | CN103824561A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 马占宇;齐峰;司中威;郭军;张洪刚 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L19/07 | 分类号: | G10L19/07;G10L25/69 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 线性 预测 编码 模型 缺失 非线性 估算 方法 | ||
技术领域
本发明涉及在分组网络中,语音传输过程中包丢失的处理问题,着重描述了一种基于变换的线谱频率参数和狄利克雷混合模型的非线性最优化估计方法。
背景技术
随着互联网技术的深入发展,语音通信技术得到了长足的进步,传输的语音信号已经由窄带信号传播演进到了宽带信号传播。伴随着多媒体应用的不断开发与推广,人们对于在语音通信技术中语音传输质量和实时性的要求越来越高,因此,研究高效可靠的语音通信算法,具有迫切的社会需求。
语音通信中要解决的首要问题是语音的编码。经过数十年的发展,语音编码技术大致可以分为三种方式:波形编码技术、基于参数模型的编码技术和混合编码技术。波形编码技术针对语音波形直接进行量化和传输,不基于声学模型。基于参数模型的编码技术将语音通过线性预测模型分析后,分别传输线性预测模型,边信息和语音能量信息。混合编码技术是上述两者的结合。
在语音编码中,基于参数模型的编码被广泛应用,其核心在于如何有效可靠的实现线性预测模型的量化和编码。在语音线性预测编码模型的研究中,一般把线性预测编码参数转化为线谱频率参数,这种表示方法较其他参数表示方法更为稳定高效,原因在于其频谱敏感区域的分布较为平均。
在分组网络中传输语音时,语音恢复的质量很大程度上取决于网络的状况。在分组网络传输的模式下,如果能够从已知信息估计出延迟或丢失的分组,可以有效地回复出语音信号,并且避免额外的延迟,从而提高语音质量,改善用户的体验。传统的缺失的和接收到的线谱频率元素间的联合分布主要由高斯混合模型进行建模,通过高斯混合模型来模拟接收到部分和丢失部分的联合分布,从而最优估计出丢失的包的信息。最新的研究表明,对于线性预测模型的编码可以通过量化线谱频率参数差值来实现,此方法比传统的基于高斯混合模型的线谱频率参数量化更为有效。在传输线谱频率差值的时候,传统的高斯混合模型无法很好地模拟数据的分布,也就不能实现最优的预测。因此,针对线谱频率差值设计相应的统计模型并由此模型来最优估计分组传输中丢失的包就显得尤为重要。
发明内容
针对现有语音传输过程中的丢包问题,本发明的目的是提供一种非线性最优化算法来估计所丢失的内容,最大限度恢复传输的语音质量。
为达到上述目的,本发明提出的非线性最优化缺失值估计方法包括下列步骤:
线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;
训练模型步骤:在发送端,使用狄利克雷混合模型(DMM-Dirichlet mixture model)模拟线谱频率参数差值的分布,采用期望最大化算法训练DMM中的各个参数;
传输过程中丢失部分和收到部分概率分布计算步骤:根据线谱频率参数差值满足狄利克雷分布(Dirichlet distribution)的假设,把线谱频率参数差值分成丢失部分和收到部分,分别归一化后得到相应的狄利克雷分布;
最小均方误差最优化估计步骤:按照最小均方误差标准,得到缺失值的最优估计。
线谱频率参数变换步骤中,利用线谱频率参数的①非负特性,②有序特性和③有界特性将其变换为线性谱参数差值ΔLSF,此差值的特征为:①分布在(0,1)开区间内,②加和为1;此步骤具体过程如下:
1)K维线谱频率参数表示为s=[s1,s2,...,sK]T,满足0<s1<s2<,…,sK<π;
2)变换后的K+1维线谱频率参数差值ΔLSF为其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410054042.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磁力环保阀门
- 下一篇:电子设备及其外壳组件