[发明专利]一种空间音频参数帧间预测编解码方法无效

专利信息
申请号: 200910062732.2 申请日: 2009-06-16
公开(公告)号: CN101582262A 公开(公告)日: 2009-11-18
发明(设计)人: 胡瑞敏;周成;杭波;王晓晨 申请(专利权)人: 武汉大学
主分类号: G10L19/04 分类号: G10L19/04
代理公司: 武汉天力专利事务所 代理人: 严 彦;冯卫平
地址: 43007*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 空间 音频 参数 预测 解码 方法
【权利要求书】:

1.一种空间音频参数帧间预测编码方法,其特征在于:包含以下步骤,

步骤1.1,对输入的多声道音频信号的帧信号分子带提取空间音频参数;

步骤1.2,根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空 间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预 测系数和空间音频参数预测残差,具体实现过程如下,

(1)设每帧信号分K个子带,第m帧的K个子带的空间音频参数记为 Sm1,Sm2,…SmK,K≥2;设第m帧之前第M帧第K个子带的空间音频参数记为S(m-M)K, 第m帧前M帧的所有子带的空间音频参数则为

S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K,M≥1; 设第m帧的第i个子带的空间音频参数帧间差值设空间音 频参数的取值范围为-f到f,则可能的取值范围为-2f到2f,这4f+1个差 值的概率分布为j=1,2...4f+1;

(2)预测方式如下,

设事件对应于第m帧的第i个子带的空间音频参数从-f到f一共2f+1种 取值,则j=1,2...2f+1互斥且构成一个完全事件,j=1,2...2f+1为事件发 生的概率,在无任何先验知识的情况下的初始值为

P(Bli1)=P(Bli2)...=P(Bli2f+1)=1/(2f+1);]]>

设定事件A为伴随事件j=1,2...2f+1发生而出现,由第m帧各子带的空间 音频参数取值得到第m+1帧各子带的空间音频参数取值可能,则由第i个子带 m帧空间音频参数取值Smi得到第m+1帧各空间音频参数取值概率为

P(A/Bmij)=P{(Dim,m+1)j-Smi+f},]]>j=1,2...2f+1;

在已知事件的概率和事件发生条件下事件A的概率的 情况下,运用贝叶斯定理得到在事件A发生条件下第m+1帧事件的发生概 率为P(B(m+1)ij/A)=P(Bmij)P(A/Bmij)Σn=12f+1P(Bmin)P(A/Bmin),]]>j=1,2...2f+1;

预测时初始化j=1,2...2f+1,然后将第m帧之前M帧的所有子带 的空间音频参数

S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K依次代入

P(A/Bqij)=P{(Diq,q+1)j-Sqi+f},]]>j=1,2...2f+1,

P(B(q+1)ij/A)=P(Bqij)P(A/Bqij)Σn=12f+1P(Bqin)P(A/Bqin),]]>j=1,2...2f+1

其中m-K≤q≤m-1;

最终得到事件A发生条件下的发生概率j=1,2...2f+1,以 j=1,2...2f+1最大的值作为对第m帧的第i个子带的空间音频参数预测系 数

设当前帧为第m帧,根据第m帧的第i子带的空间音频参数Smi和空间音频 参数预测系数计算当前帧的第i子带的空间音频参数预测残差i取1~K;

步骤1.3,对当前帧的空间音频参数预测残差进行编码得到编码码流。

2.一种与权利要求1所述空间音频参数帧间预测编码方法相应的空间音频参数 帧间预测解码方法,其特征在于:包含以下步骤,

步骤2.1,从编码码流中解码得到帧信号的空间音频参数预测残差;

步骤2.2,用当前帧之前重建得到的一帧或多帧空间音频参数及步骤2.1所 得当前帧的空间音频参数预测残差,重建得到当前帧的空间音频参数,具体实 现过程如下,

设当前帧为第m帧,第m帧的空间音频参数预测残差记为δm1,δm2,....δmK,当 前帧的K个子带的空间音频参数记为Sm1,Sm2,…SmK,之前解码得到的M帧K个子 带的空间音频参数记为

S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K,K≥2, M≥1;

根据空间音频参数帧间差值的统计分布特性和之前M帧的第i子带的空间 音频参数,初始化事件j=1,2...2f+1,然后将当前帧之前M帧的K个 子带的空间音频参数

S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K依次代入

P(A/Bqij)=P{(Diq,q+1)j-Sqi+f},]]>j=1,2...2f+1,

P(B(q+1)ij/A)=P(Bqij)P(A/Bqij)Σn=12f+1P(Bqin)P(A/Bqin),]]>j=1,2...2f+1

其中m-K≤q≤m-1

最终得到事件A发生条件下的发生概率j=1,2...2f+1,以 j=1,2...2f+1最大的值作为对当前帧的第i子带的空间音频参数预测系数 i取1~K;

根据当前帧的第i子带的空间音频参数预测残差δmi和空间音频参数预测系 数得到当前帧的第i子带的空间音频参数

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910062732.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top