[发明专利]用于降低空间参数误码率的三维音频编码方法及装置有效
申请号: | 201510400001.X | 申请日: | 2015-07-09 |
公开(公告)号: | CN104978967B | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 胡瑞敏;杨乘;苏柳月;王晓晨;涂卫平;高戈;姜林;武庭照;柯善发 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 降低 空间 参数 误码率 三维 音频 编码 方法 装置 | ||
本发明提供了用于降低空间参数误码率的三维音频编码方法及装置,以提高重建三维音频空间感知质量,包括将3D音频码流的3D空间参数部分作为MIB部分,为MIB部分添加窗W1;将3D音频码流的下混单声道信号部分作为LIB部分,并为MIB部分和LIB部分添加窗W2;选择窗W1和窗W2之一,随机产生一个度数d,从所选窗Wi中随机选取d个符号并进行模为2的异或运算,得到一个编码符号;返回生成新的编码符号,直至输出编码码流。本发明基于不等差错保护的思想,通过对重建三维音频空间感知质量起着更关键作用的空间参数部分的更重点保护,降低三维音频空间参数部分的误码率,提高重建三维音频的空间感知质量。
技术领域
本发明涉及数字音频领域,针对提高重建三维音频空间感知质量的需求,尤其涉及一种基于不等差错保护来降低三维音频空间参数误码率的编码技术方案。
背景技术
2009年底,三维电影《阿凡达》在全球三十多个国家登上票房榜首,到2010年9月初,全球累计票房超过27亿美元。《阿凡达》之所以能取得如此辉煌的票房成绩,在于它所采用的全新的三维特效制作技术带给人们感官上的震撼效果。要想达到更好的视听体验,还需要有与三维视频内容同步的三维声场听觉效果,才能真正达到身临其境的视听感受。
3D音频通常的输出码流结构包括两部分:下混单声道信号部分和3D空间参数部分。而随着越来越高的3D空间分辨率以及越来越多的声道或对象数量,编码声道和空间参数的比特率会线性地急剧地增加,这就要求更大的带宽来传输3D音频。
因此,当带宽有限且聚焦于3D音频的空间感知质量时,3D码流中的空间参数部分就具有相对而言更高的重要性,需要更多的保护。
发明内容
本发明的目的在于针对带宽有限且需要保证3D音频的空间感知质量的现状,提供一种用于降低3D音频空间参数误码率的UEP编码方案。
本发明的技术方案提供一种用于降低空间参数误码率的三维音频编码方法,编码过程包括以下步骤,
步骤C1,设输入为经信源编码器编码所得大小为n bits的3D音频码流,将该3D音频码流的3D空间参数部分作为MIB部分,其大小为α1n bits,α1为系数,0<α1<1;为MIB部分添加窗W1,窗W1只包含MIB部分相应的3D空间参数比特集合S1;所述MIB部分为更重要比特部分;
步骤C2,将3D音频码流的下混单声道信号部分作为LIB部分,并添加窗W2,窗W2包含MIB部分相应的3D空间参数比特集合S1和LIB部分相应的下混单声道信号比特集合S2;所述LIB部分为次重要比特部分;
步骤C3,选择窗W1和窗W2之一,包括根据选择概率τi来选择窗Wi,i=1,2,其中,τ1是窗W1相应的选择概率,τ2是窗W2相应的选择概率,τ2=1-τ1,0≤τ1≤1;
步骤C4,随机产生一个度数d,包括根据步骤C3所选窗Wi相应的度分布函数Ωi(x)选择一个度数d;
步骤C5,从步骤C3所选窗Wi中随机选取d个符号并进行模为2的异或运算,得到一个编码符号;
步骤C6,返回步骤C3生成新的编码符号,直至得到m个编码符号,输出大小为mbits的编码码流;其中,m=γn,γ为预设的解码开销。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510400001.X/2.html,转载请声明来源钻瓜专利网。