[发明专利]一种3D音频中水平方位参数量化方法有效
申请号: | 201210256992.5 | 申请日: | 2012-07-24 |
公开(公告)号: | CN102760442A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 胡瑞敏;王晓晨;刘梦颖;冯云杰;章佩;杨姗姗;涂卫平;杨玉红;李登实 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种3D音频中水平方位参数量化方法,考虑了人耳在不同频带的感知能力,引入了人耳可感知的最小差异JND值;在量化客观失真的基础上,将其与JND值进行结合运算得到主观感知失真,以此为依据选出最符合人耳感知特性的码字作为量化结果。利用这种技术方案进行量化,量化结果的人耳主观感知性能较好。 | ||
搜索关键词: | 一种 音频 水平 方位 参数 量化 方法 | ||
【主权项】:
1.一种3D音频中水平方位参数量化方法,其特征在于,包括以下步骤:步骤1.1、设3D音频的子带总数为N,输入N个子带的水平方位参数x1,x2,…,xN,通过查表得到对应的JND值jnd1,jnd2,…,jndN;步骤1.2、按照预设的维数k,划分得到多个k维的水平方位参数矢量[(x1,x2,…,xk)(xk+1,xk+2,…,x2k)…(xN-k+1,xN-k+2,…,xN)],根据划分结果生成相应的码本;同时将对应的JND值划分成多个k维矢量[(jnd1,jnd2,…,jndk)(jndk+1,jndk+2,…,jnd2k)…(jndN-k+1,jndN-k+2,…,jndN)];步骤1.3、对每个水平方位参数矢量(xi+1,xi+2,…,xi+k)进行量化,得到k维码字矢量(yi+1,yi+2,…,yi+k),i的取值为1,k+1…N-k+1;实现方式为,对每个水平方位参数矢量(xi+1,xi+2,…,xi+k)执行以下子步骤,步骤1.3.1、从码本中按顺序读入一个码字,将读入的码字作为k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果;步骤1.3.2、根据1.3.1所得k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果和步骤1.2所得相应的k维矢量(jndi+1,jndi+2,…,jndi+k)计算量化的主观感知失真步骤1.3.3、返回步骤1.3.1从码本中按顺序读入下一个码字并作为k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果,直到遍历完码本中的码字,然后根据每次执行步骤1.3.2的结果选择其中主观感知失真Dsp的值最小的相应码字作为k维码字矢量(yi+1,yi+2,…,yi+k)的最终量化结果;步骤1.4、根据步骤1.3.3所得k维码字矢量[(y1,y2,…,yk)(yk+1,yk+2,…,y2k)…(yN-k+1,yN-k+2,…,yN)]的最终量化结果,输出N个子带的量化水平方位参数{y1,y2,…,yN}以及相应索引值Index1,Index2,…,IndexN,将索引值输出至码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210256992.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种玻璃钢窗装配生产线
- 下一篇:基于模糊控制的微网电池储能系统调频控制方法