[发明专利]一种空间音频参数帧间预测编解码方法无效

申请号：	200910062732.2	申请日：	2009-06-16
公开（公告）号：	CN101582262A	公开（公告）日：	2009-11-18
发明（设计）人：	胡瑞敏;周成;杭波;王晓晨	申请（专利权）人：	武汉大学
主分类号：	G10L19/04	分类号：	G10L19/04
代理公司：	武汉天力专利事务所	代理人：	严彦;冯卫平
地址：	43007***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了基于贝叶斯梯度模型的空间音频参数帧间预测技术方案。编码过程：对输入的多声道音频信号的帧信号分子带提取空间音频参数；根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测，得到当前帧的空间音频参数预测系数和空间音频参数预测残差；对当前帧的空间音频参数预测残差进行编码得到编码码流。解码过程：从编码码流中解码得到帧信号的空间音频参数预测残差；用之前重建得到的一帧或多帧空间音频参数及当前帧的空间音频参数预测残差，得到空间音频参数预测系数，然后重建得到当前帧的空间音频参数。本发明考虑了空间音频参数的时域相关性，可有效降低编码码率。
搜索关键词：	一种空间音频参数预测解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种空间音频参数帧间预测编码方法，其特征在于：包含以下步骤，步骤1.1，对输入的多声道音频信号的帧信号分子带提取空间音频参数；步骤1.2，根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测，得到当前帧的空间音频参数预测系数和空间音频参数预测残差，具体实现过程如下，(1)设每帧信号分K个子带，第m帧的K个子带的空间音频参数记为S_m1，S_m2，…S_mK，K≥2；设第m帧之前第M帧第K个子带的空间音频参数记为S_(m-M)K，第m帧前M帧的所有子带的空间音频参数则为S_(m-M)1，S_(m-M)2，…S_(m-M)K，S_(m-M+1)1，S_(m-M+1)2，…S_(m-M+1)K，…S_(m-1)1，S_(m-1)2，…S_(m-1)K，M≥1；设第m帧的第i个子带的空间音频参数帧间差值Dim,m+1=S(m+1)i-Smi,]]>设空间音频参数的取值范围为-f到f，则D_i^m，m+1可能的取值范围为-2f到2f，这4f+1个差值的概率分布为P{(Dim,m+1)j},j=1,2...4f+1;]]>(2)预测方式如下，设事件B_mi^j对应于第m帧的第i个子带的空间音频参数从-f到f一共2f+1种取值，则B_mi^j，j＝1，2...2f+1互斥且构成一个完全事件，P(B_mi^j)，j＝1，2...2f+1为事件B_mi^j发生的概率，在无任何先验知识的情况下P(B_mi^j)的初始值为P(B1i1)=P(B1i2)...=P(B1i2f+1)=1/2f+1;]]>设定事件A为伴随事件B_mi^j，j＝1，2...2f+1发生而出现，由第m帧各子带的空间音频参数取值得到第m+1帧各子带的空间音频参数取值可能，则由第i个子带m帧空间音频参数取值S_mi得到第m+1帧各空间音频参数取值概率为P(A/Bmij)=P{(Dim,m+1)j-Smi+f},j=1,2...,f+1;]]>在已知事件B_mi^j的概率P(B_mi^j)和事件B_mi^j发生条件下事件A的概率P(A/B_mi^j)的情况下，运用贝叶斯定理得到在事件A发生条件下第m+1帧事件B_(m+1)i^j的发生概率为P(B(m+1)ij/A)=P(Bmij)P(A/Bmij)Σn=12f+1P(Bmin)P(A/Bmin),j=1,2...2f+1;]]>预测时初始化B(m-K)ij=12f+1,j=1,2...2f+1,]]>然后将第m帧之前M帧的所有子带的空间音频参数S_(m-M)1，S_(m-M)2，…S_(m-M)K，S_(m-M+1)1，S_(m-M+1)2，…S_(m-M+1)K，…S_(m-1)1，S_(m-1)2，…S_(m-1)K依次代入P(A/Bqij)=P{(Diq,q+1)j-Sqi+f},j=1,2...2f+1,]]>P(B(q+1)ij/A)=P(Bqij)P(A/Bqij)Σn=12f+1P(Bqin)P(A/Bqin),j=1,2...2f+1]]>其中m-K≤q≤m-1；最终得到事件A发生条件下B_mi^j的发生概率P(B_mi^j/A)，j＝1，2...2f+1，以P(B_mi^j/A)，j＝1，2...2f+1最大的值作为对第m帧的第i个子带的空间音频参数预测系数设当前帧为第m帧，根据第m帧的第i子带的空间音频参数S_mi和空间音频参数预测系数计算当前帧的第i子带的空间音频参数预测残差δmi=Smi-Smi^,]]>i取1～K；步骤1.3，对当前帧的空间音频参数预测残差进行编码得到编码码流。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200910062732.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种空间音频参数帧间预测编解码方法无效

专利文献下载