[发明专利]音频信号处理装置和方法有效
申请号: | 201580079276.6 | 申请日: | 2015-04-30 |
公开(公告)号: | CN107533844B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 潘吉·赛提亚万;卡里姆·赫尔旺尼 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 装置 方法 | ||
1.一种音频信号下混装置(105),所述音频信号下混装置(105)用于使用下混矩阵(D)将包括多个输入声道(113)的输入音频信号处理成包括多个主输出声道(123)和至少一个辅助输出声道(125)的输出音频信号,其特征在于,所述下混矩阵(D)包括用于提供所述多个主输出声道(123)的主下混矩阵(DU)和用于提供所述至少一个辅助输出声道(125)的辅助下混矩阵(DW),所述音频信号下混装置(105)包括:
辅助下混矩阵确定器(107),用于通过以下操作确定所述辅助下混矩阵(DW):
计算由所述输入音频信号的所述多个输入声道(113)定义的协方差矩阵(COV)的多个特征向量;
为所述协方差矩阵(COV)的所述多个特征向量中的至少一个特征向量确定所述至少一个特征向量与由所述主下混矩阵(DU)的列定义的向量之间的子空间角;
基于所述子空间角和预设阈值角θMIN从所述多个特征向量中选择至少一个特征向量;及
通过所述至少一个选择的特征向量来定义所述辅助下混矩阵(DW)的至少一列;以及
处理器(109),用于使用所述下混矩阵(D)将所述输入音频信号处理成所述输出音频信号;
所述辅助下混矩阵确定器(107)用于通过确定所述协方差矩阵(COV)的所述多个特征向量中的每个特征向量与由所述主下混矩阵(DU)的所述列定义的多个向量之间的多个角中的最小角来确定所述子空间角。
2.根据权利要求1所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过选择所述子空间角大于所述预设阈值角θMIN的特征向量,来基于所述子空间角和所述预设阈值角θMIN从所述多个特征向量中选择特征向量。
3.根据任一项前述权利要求所述的音频信号下混装置(105),其特征在于,所述主下混矩阵(DU)的大小由所述输入音频信号的输入声道(113)的数量和所述输出音频信号的主输出声道(123)的数量确定。
4.根据权利要求1或2所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵(DW)的大小由所述输出音频信号的辅助输出声道(125)的数量确定。
5.根据权利要求1或2所述的音频信号下混装置(105),其特征在于,所述音频信号下混装置(105)还包括:主下混矩阵确定器(111),用于基于固定波束成形器方法或自适应波束成形器方法确定所述主下混矩阵(DU)。
6.根据权利要求1或2所述的音频信号下混装置(105),其特征在于,所述处理器(109)用于以多个输入音频时间帧的形式处理所述多个输入声道(113)中的每一个的所述输入音频信号,并且所述处理器(109)还用于通过以下操作处理所述输入音频信号:为所述多个输入声道(113)中的每一个确定多个输入音频信号时间帧的离散傅立叶变换,得到所述多个输入音频信号时间帧及所述输入音频信号的所述多个输入声道(113)在多个频率点处的多个傅立叶系数。
7.根据权利要求6所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过以下操作确定所述辅助下混矩阵(DW):使用以下等式为所述多个输入音频信号时间帧的给定输入音频信号时间帧n以及为所述多个频率点的给定频率点j确定所述协方差矩阵(COV)的系数cxy:
其中E{}表示期望算子,jx表示所述输入音频信号的输入声道x在频率点j处的傅立叶系数,*表示复共轭,x和y的范围是从1到输入声道(113)的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580079276.6/1.html,转载请声明来源钻瓜专利网。