[发明专利]音频信号处理装置和方法有效
申请号: | 201580075785.1 | 申请日: | 2015-04-30 |
公开(公告)号: | CN107211229B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 潘吉·赛提亚万;卡里姆·赫尔旺尼 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04S3/02 | 分类号: | H04S3/02;G10L19/008;G10L21/007 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 装置 方法 | ||
1.一种用于将输入音频信号处理为输出音频信号的音频信号下混装置(105),其特征在于,所述输入音频信号包括在多个空间位置处记录的多个输入声道(113),所述输出音频信号包括多个主输出声道(123),所述音频信号下混装置(105)包括:
下混矩阵确定器(107),用于为多个频率点中的每个频率点j确定下混矩阵(DU),其中j是范围从1到N的整数;对于给定频率点j,所述下混矩阵(DU)将与所述输入音频信号的所述多个输入声道(113)相关联的多个傅立叶系数映射到所述输出音频信号的所述主输出声道(123)的多个傅立叶系数;对于j小于或等于截止频率点k的频率点,所述下混矩阵(DU)通过确定离散Laplace-Beltrami算子(L)的特征向量来确定,所述离散Laplace-Beltrami算子(L)通过记录所述多个输入声道(113)的多个空间位置定义;对于j大于所述截止频率点k的频率点,所述下混矩阵(DU)通过确定协方差矩阵(COV)的特征向量的第一子集来确定,所述协方差矩阵(COV)通过所述输入音频信号的所述多个输入声道(113)定义;以及
处理器(109),用于使用所述下混矩阵(DU)将所述输入音频信号处理为所述输出音频信号。
2.根据权利要求1所述的音频信号下混装置(105),其特征在于,所述下混矩阵确定器(107)用于使用以下等式确定所述离散Laplace-Beltrami算子(L):
L=C-W
C=diag{c}
c=[c1,…,cp,…,cQ]
其中,L、C和W是各自维度为QxQ的矩阵,其中Q是输入声道(113)的数量,diag(…)表示将输入向量元素作为输出矩阵的对角线而其余矩阵元素为0的矩阵对角化运算,c是维度Q的向量,wpq是局部平均系数。
3.根据权利要求2所述的音频信号下混装置(105),其特征在于,所述下混矩阵确定器(107)用于使用以下等式确定所述局部平均系数wpq:
p≠q
wpq=0;p=q
其中rp或rq是定义所述多个空间位置中的一个空间位置的向量,其中在所述多个空间位置处记录所述输入音频信号的所述多个输入声道(113)。
4.根据前述权利要求中的任一项所述的音频信号下混装置(105),其特征在于,对于j小于或等于所述截止频率点k的频率点,通过选择所述离散Laplace-Beltrami算子(L)的特征值大于预定义阈值的所述特征向量来确定所述下混矩阵(DU)。
5.根据权利要求1~3中的任一项所述的音频信号下混装置(105),其特征在于,对于j大于所述截止频率点k的频率点,通过选择所述协方差矩阵(COV)的特征值大于预定义阈值的所述特征向量来确定所述下混矩阵(DU)。
6.根据权利要求1~3中的任一项所述的音频信号下混装置(105),其特征在于,所述下混矩阵确定器(107)用于通过以下操作确定所述截止频率点k:确定所述多个频率点中的密实度程度θC大于预定义阈值T的所有频率点中的所述密实度程度θC最小的频率点,其中频率点的所述密实度程度θC使用以下等式确定:
其中,表示包含所述离散Laplace-Beltrami算子(L)的选定特征向量的酉矩阵,表示的厄米特转置,diag(…)表示将除了沿着给出矩阵输入的矩阵的对角线的系数之外的所有系数归零的矩阵对角化运算,off(…)表示将所述矩阵的所述对角线上的所有系数归零的矩阵运算,‖…‖F表示Frobenius范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580075785.1/1.html,转载请声明来源钻瓜专利网。