[发明专利]一种空间音频参数帧间预测编解码方法无效
申请号: | 200910062732.2 | 申请日: | 2009-06-16 |
公开(公告)号: | CN101582262A | 公开(公告)日: | 2009-11-18 |
发明(设计)人: | 胡瑞敏;周成;杭波;王晓晨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 武汉天力专利事务所 | 代理人: | 严 彦;冯卫平 |
地址: | 43007*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了基于贝叶斯梯度模型的空间音频参数帧间预测技术方案。编码过程:对输入的多声道音频信号的帧信号分子带提取空间音频参数;根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差;对当前帧的空间音频参数预测残差进行编码得到编码码流。解码过程:从编码码流中解码得到帧信号的空间音频参数预测残差;用之前重建得到的一帧或多帧空间音频参数及当前帧的空间音频参数预测残差,得到空间音频参数预测系数,然后重建得到当前帧的空间音频参数。本发明考虑了空间音频参数的时域相关性,可有效降低编码码率。 | ||
搜索关键词: | 一种 空间 音频 参数 预测 解码 方法 | ||
【主权项】:
1.一种空间音频参数帧间预测编码方法,其特征在于:包含以下步骤,步骤1.1,对输入的多声道音频信号的帧信号分子带提取空间音频参数;步骤1.2,根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差,具体实现过程如下,(1)设每帧信号分K个子带,第m帧的K个子带的空间音频参数记为Sm1,Sm2,…SmK,K≥2;设第m帧之前第M帧第K个子带的空间音频参数记为S(m-M)K,第m帧前M帧的所有子带的空间音频参数则为S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K,M≥1;设第m帧的第i个子带的空间音频参数帧间差值D i m , m + 1 = S ( m + 1 ) i - S mi , ]]> 设空间音频参数的取值范围为-f到f,则Dim,m+1可能的取值范围为-2f到2f,这4f+1个差值的概率分布为P { ( D i m , m + 1 ) j } , j = 1,2 . . . 4 f + 1 ; ]]> (2)预测方式如下,设事件Bmij对应于第m帧的第i个子带的空间音频参数从-f到f一共2f+1种取值,则Bmij,j=1,2...2f+1互斥且构成一个完全事件,P(Bmij),j=1,2...2f+1为事件Bmij发生的概率,在无任何先验知识的情况下P(Bmij)的初始值为P ( B 1 i 1 ) = P ( B 1 i 2 ) . . . = P ( B 1 i 2 f + 1 ) = 1 / 2 f + 1 ; ]]> 设定事件A为伴随事件Bmij,j=1,2...2f+1发生而出现,由第m帧各子带的空间音频参数取值得到第m+1帧各子带的空间音频参数取值可能,则由第i个子带m帧空间音频参数取值Smi得到第m+1帧各空间音频参数取值概率为P ( A / B mi j ) = P { ( D i m , m + 1 ) j - S mi + f } , j = 1,2 . . . , f + 1 ; ]]> 在已知事件Bmij的概率P(Bmij)和事件Bmij发生条件下事件A的概率P(A/Bmij)的情况下,运用贝叶斯定理得到在事件A发生条件下第m+1帧事件B(m+1)ij的发生概率为P ( B ( m + 1 ) i j / A ) = P ( B mi j ) P ( A / B mi j ) Σ n = 1 2 f + 1 P ( B mi n ) P ( A / B mi n ) , j = 1,2 . . . 2 f + 1 ; ]]> 预测时初始化B ( m - K ) i j = 1 2 f + 1 , j = 1,2 . . . 2 f + 1 , ]]> 然后将第m帧之前M帧的所有子带的空间音频参数S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K依次代入P ( A / B qi j ) = P { ( D i q , q + 1 ) j - S qi + f } , j = 1,2 . . . 2 f + 1 , ]]>P ( B ( q + 1 ) i j / A ) = P ( B qi j ) P ( A / B qi j ) Σ n = 1 2 f + 1 P ( B qi n ) P ( A / B qi n ) , j = 1,2 . . . 2 f + 1 ]]> 其中m-K≤q≤m-1;最终得到事件A发生条件下Bmij的发生概率P(Bmij/A),j=1,2...2f+1,以P(Bmij/A),j=1,2...2f+1最大的值作为对第m帧的第i个子带的空间音频参数预测系数
设当前帧为第m帧,根据第m帧的第i子带的空间音频参数Smi和空间音频参数预测系数
计算当前帧的第i子带的空间音频参数预测残差δ mi = S mi - S mi ^ , ]]> i取1~K;步骤1.3,对当前帧的空间音频参数预测残差进行编码得到编码码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910062732.2/,转载请声明来源钻瓜专利网。
- 上一篇:具有极低折射率的液晶组合物
- 下一篇:空间数字化大地测量方法及装置