[发明专利]音频译码中的高效格式转换有效
申请号: | 201780009814.3 | 申请日: | 2017-02-03 |
公开(公告)号: | CN108701463B | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 韦莎·罗皮拉 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G06F17/16 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 刘锋 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 译码 中的 高效 格式 转换 | ||
本发明涉及一种对多个输入音频通道进行降混的方法。所述方法包含:针对所述输入音频通道中的每一个获得多个对应频率区间中的多个频率系数;且针对至少一个频率区间将降混矩阵应用于由用于所述相应频率区间的所述多个输入音频通道的所述频率系数形成的第一阵列以获得由用于所述相应频率区间的多个中间音频通道的所述频率系数形成的第二阵列。所述方法进一步涉及:确定仅包含所述降混矩阵的非零条目的第三阵列;以及确定第四阵列,所述第四阵列针对所述第三阵列的每一条目包含指示所述第三阵列的相应条目在所述降混矩阵内的位置的条目。将所述降混矩阵应用于所述第一阵列涉及针对所述至少一个频率区间将所述第三阵列的所述条目与用于所述相应频率区间的所述第一阵列的对应条目相乘,所述第一阵列的所述对应条目是基于所述第四阵列而确定。本发明进一步涉及用于对多个输入音频通道进行降混的对应设备以及经配置以用于对多个输入音频通道进行降混的对应程序存储装置。
技术领域
本文档涉及用于音频信号的格式转换(包含降混)的方法和设备。确切地说,本文档涉及用于例如在MPEG-H 3D音频标准的背景下的简化且更高效格式转换的方法和设备。
背景技术
MPEG-H 3D音频标准的主规范的格式转换器是一种降混器,其将来自具有Nin个通道的发射通道配置的多信道音频信号转换为具有Nout≤Nin个通道的所需再生格式。此降混器特征在于相位对准有效降混算法,所述算法确保能量保留,而且用以防止或减少不受控的信号消除或信号放大,所述不受控的信号消除或信号放大原本将导致不希望的信号着色和假象。不利的一面是,所述降混算法具有高计算复杂性且对解码器赋予高计算负载。举例来说,对于从22.2通道到立体声的降混,主规范中的完整解码器复杂性的约50%被分配给降混算法。
对于大数目Nin个输入通道最前产生高计算复杂性。对于通常具有比较小的计算能力,但再现由大量通道表征的高质量广播内容的装置来说,计算负载是特别关键的。
因此,需要一种简单且高效的格式转换器,其仍维持关于音频信号质量和能量保留的有利性质。
发明内容
根据本发明的方面,描述一种对多个输入音频通道进行降混的方法。所述方法可包含针对所述输入音频通道中的每一个获得多个对应频率区间(变换域频率区间)中的多个频率系数。所述获得步骤可涉及从位流接收频率系数,或将时间-频率变换应用于输入音频通道中的每一个以获得(针对输入音频通道中的每一个)所述多个对应频率区间中的所述多个频率系数。所述时间-频率变换可以是短时傅立叶变换(STFT)。确切地说,所述时间-频率变换可以是离散傅立叶变换(DFT)(例如,快速傅立叶变换(FFT))。所述方法可进一步包含针对至少一个频率区间将降混矩阵应用于由用于所述相应频率区间的所述多个输入音频通道的所述频率系数形成的第一阵列以获得由用于所述相应频率区间的多个中间音频通道的所述频率系数形成的第二阵列。所述第一和第二阵列可为线性阵列(向量)。第一阵列的条目(元素)的数目可由输入音频通道的数目给定,且第二阵列的条目的数目可由输出音频通道的数目给定。降混矩阵对于不同频率区间可为不同的,或对于不同音频带(处理带)可为不同的。在实施例中,降混矩阵跨越频率区间或音频带可为均匀的。所述方法可进一步涉及确定仅包含降混矩阵的非零条目(元素)的第三阵列。所述方法可进一步涉及确定第四阵列,所述第四阵列针对第三阵列的每一条目包含指示第三阵列的相应条目在降混矩阵内的位置的条目。将所述降混矩阵应用于所述第一阵列可涉及针对所述至少一个频率区间将所述第三阵列的所述条目与用于所述相应频率区间的所述第一阵列的对应条目相乘,所述第一阵列的所述对应条目是基于所述第四阵列而确定。其中,第一阵列内的对应条目应理解为指示在降混矩阵和第一阵列的常见矩阵乘法中将与降混矩阵的相应非零条目相乘的条目。应用降混矩阵可进一步涉及对所获得乘积的适当求和以及将所获得乘积的(一或多个)的总和指派于第二阵列的条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780009814.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:加权矩阵系数的自适应量化
- 下一篇:多个音频信号的编码