[发明专利]处理声音数据以分离多声道信号中的声源有效
申请号: | 201880037758.9 | 申请日: | 2018-05-24 |
公开(公告)号: | CN110709929B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | M.巴奎;A.格林 | 申请(专利权)人: | 奥兰治 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/84;G10L21/0216;G10L25/06;G10L21/0208;G10L21/0308 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 李芳华 |
地址: | 法国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 声音 据以 分离 多声道 信号 中的 声源 | ||
1.一种用于处理声音数据以分离在真实环境中捕获的多声道声音信号的N个声源的方法,其特征在于,该方法包括以下步骤:
-将源分离处理应用(E310)于所捕获的多声道声音信号,并获得分离矩阵和一组M个声音分量,其中,M≥N;
-计算(E320)一组所谓的双变量第一描述符,该组双变量第一描述符表示所获得的该组M个分量的对中的分量之间的统计关系;
-计算(E320)一组所谓的单变量第二描述符,该组所谓的单变量第二描述符表示所获得的该组M个分量中的分量的编码特性;
-根据该组第一描述符和该组第二描述符,使用对属于两个类别之一的概率的计算(E330)来将该组M个分量分类(E340)为这两个类别的分量,第一类别具有被称为直接分量的、对应于这N个直接声源的N个分量,并且第二类别具有被称为混响分量的M-N个分量。
2.如权利要求1所述的方法,其中,计算双变量第一描述符包括计算两个分量之间的相干性得分。
3.如权利要求1和2中任一项所述的方法,其中,计算双变量第一描述符包括确定一对中的两个分量之间的延迟。
4.如权利要求3所述的方法,其中,两个分量之间的延迟是通过考虑使该对中的这两个分量之间的互相关函数最大化的延迟来确定的。
5.如权利要求3所述的方法,其中,一对中的两个分量之间的延迟的确定与该延迟的符号的可靠性指标相关联,该指标取决于该对中的分量之间的相干性。
6.如权利要求3所述的方法,其中,一对中的两个分量之间的延迟的确定与该延迟的符号的可靠性指标相关联,该指标取决于具有相反符号的延迟的互相关函数的最大值的比率。
7.如权利要求1和2中任一项所述的方法,其中,对单变量第二描述符的计算取决于基于源分离步骤所估计的混合矩阵的混合系数与平面波源的编码特征之间的匹配。
8.如权利要求1和2中任一项所述的方法,其中,该组M个分量中的分量是通过考虑该组M个分量并通过计算这M个分量的分类的最可能组合来分类的。
9.如权利要求8所述的方法,其中,该最可能组合是通过针对这M个分量的可能分类组合确定被表达为与所述双变量第一描述符和所述单变量第二描述符相关联的条件概率的乘积的似然值的最大值来计算的。
10.如权利要求8所述的方法,其中,在计算该最可能组合的步骤之前,仅基于这些单变量第二描述符来执行这些可能组合的预选择步骤。
11.如权利要求1和2中任一项所述的方法,其中,在计算这些双变量第一描述符的步骤之前,仅基于这些单变量第二描述符来执行这些分量的预选择步骤。
12.如权利要求1和2中任一项所述的方法,其中,该多声道声音信号是高保真立体声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥兰治,未经奥兰治许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880037758.9/1.html,转载请声明来源钻瓜专利网。