[发明专利]基于通知源分离的音频对象编码的方法和装置在审
申请号: | 201680077124.7 | 申请日: | 2016-11-25 |
公开(公告)号: | CN108431891A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | Q.K.N.董;A.奥泽罗夫 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G10L19/26 | 分类号: | G10L19/26;G10L19/008 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 赵碧洋 |
地址: | 法国伊西*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 时间激活 比特流 音频混合 通知源 音频源 非零 索引 方法和装置 解码器 非零系数 分离技术 解码矩阵 音频对象 边信息 稀疏 恢复 通用 | ||
1.一种音频编码的方法,包括:
访问(810)与音频源相关联的音频混合;
将所述音频混合和用于所述音频源的时间激活矩阵的非零组的索引编码(840)到比特流中,所述组对应于所述时间激活矩阵的一行或更多行,所述时间激活矩阵是基于所述音频源和通用谱模型被确定的;以及
提供(870)所述比特流作为输出。
2.如权利要求1所述的方法,包括提供所述时间激活矩阵的非零组的系数作为所述输出。
3.一种音频解码的方法,包括:
访问(1220)与音频源相关联的音频混合;
访问(1220)用于所述音频源的第一时间激活矩阵的非零组的索引,所述组对应于所述第一时间激活矩阵的一行或更多行;
访问(1240)所述音频源的时间激活矩阵的非零组的系数;以及
基于所述第一时间激活矩阵的非零组的系数和所述音频混合来重建(1250)所述音频源。
4.如权利要求3所述的方法,其中基于通用谱模型来重建所述音频源。
5.如权利要求3所述的方法,其中从比特流中解码所述第一时间激活矩阵的非零组的系数。
6.如权利要求3所述的方法,其中将所述第一时间激活矩阵的另一组的系数设置为零。
7.如权利要求3所述的方法,其中基于所述音频混合、所述时间激活矩阵的非零组的索引以及所述通用谱模型来确定所述第一时间激活矩阵的非零组的系数。
8.如权利要求7所述的方法,其中所述音频混合与多个音频源相关联,并且其中基于所述音频混合、所述多个音频源的时间激活矩阵的非零组的索引以及所述通用谱模型来确定第二时间激活矩阵。
9.如权利要求8所述的方法,其中所述第二时间激活矩阵的组的系数在通过所述多个音频源中的每一个将所述组指示为零的情况下被设置为零。
10.如权利要求8所述的方法,其中所述第一时间激活矩阵的非零组的系数根据所述第二时间激活矩阵被确定。
11.如权利要求10所述的方法,其中将所述第一时间激活矩阵的非零组的系数设置为所述第二时间激活矩阵的对应组的系数。
12.如权利要求10所述的方法,其中所述第一时间激活矩阵的非零组的系数基于指示所述组为非零的源的数量被确定。
13.一种音频编码的装置,包括存储器和被配置用于以下的一个或更多个处理器:
访问(810)与音频源相关联的音频混合;
将所述音频混合和用于所述音频源的时间激活矩阵的非零组的索引编码(840)到比特流中,所述组对应于所述时间激活矩阵的一行或更多行,所述时间激活矩阵是基于所述音频源和通用谱模型被确定的;以及
提供(870)所述比特流作为输出。
14.一种音频解码的装置,包括存储器和被配置为执行音频解码的方法的一个或更多个处理器,所述方法包括:
访问(1220)与音频源相关联的音频混合;
访问(1220)用于所述音频源的第一时间激活矩阵的非零组的索引,所述组对应于所述第一时间激活矩阵的一行或更多行;
访问(1240)所述音频源的时间激活矩阵的非零组的系数;以及
基于所述第一时间激活矩阵的非零组的系数和所述音频混合来重建(1250)所述音频源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680077124.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多音频信号的编码
- 下一篇:用于硬盘驱动器的具有高速传输的气密密封电连接器