[发明专利]音频源参数化有效
申请号: | 201780028437.8 | 申请日: | 2017-04-05 |
公开(公告)号: | CN109074818B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 王珺 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028;G10L21/0308 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 参数 | ||
本发明描述一种用于从混合音频信号(102)估计音频源(101)的源参数的方法(600)。所述混合音频信号(102)包括多个帧。所述混合音频信号(102)可表示为频域中的混合音频矩阵且所述音频源(101)可表示为所述频域中的源矩阵。所述方法(600)包括基于混合矩阵(225)更新(601)非混合矩阵(221),所述非混合矩阵(221)经配置以提供从所述混合音频矩阵对所述源矩阵的估计,所述混合矩阵(225)经配置以提供从所述源矩阵对所述混合音频矩阵的估计。此外,所述方法(600)包括基于所述非混合矩阵(221)且基于所述混合音频信号(102)更新(602)所述混合矩阵(225)。另外,所述方法(600)包括迭代(603)所述更新步骤(601、602)直到满足整体收敛准则。
技术领域
本发明涉及音频内容处理,且更特定来说,涉及一种用于从混合音频信号估计音频源的源参数的方法及系统。
背景技术
多声道格式的混合音频信号(例如立体声信号、波束成形、5.1或7.1信号等等)是通过在演播室中混合不同音频源来创建,或在真实环境中从多个音频源记录生成。源参数化是估计这些音频源的源参数以用于进一步音频处理应用的任务。此类源参数包含关于音频源的信息,例如混合参数、位置元数据、频谱功率参数、频谱及时间特征等等。源参数对广泛范围的音频处理应用是有用的。例如,当使用一或多个麦克风记录听觉场景时,可能有益的是为不同的后续音频处理任务分离及标识音频源相关信息。音频处理应用的实例包含空间音频编码、3D(三维)声音分析及合成及/或重新混合/重新创作。与创建原始混合音频信号的环境相比,重新混合/重新创作应用可在扩展的回放环境中显现音频源。出于例如自动语音识别的各种目的,其它应用利用音频源参数来实现音频源特定分析及后处理,例如增强、衰减或调平某些音频源。
鉴于前述内容,所属领域中需要一种用于即使关于音频源或关于捕获过程的先验信息不可用(例如记录装置的性质、房间的声学性质等等)仍从混合音频信号估计音频源参数的解决方案。此外,需要一种用于在嘈杂环境中估计源参数的强健无监督解决方案。
本发明解决提供用于以准确且强健的方式从混合音频信号估计多个音频源的源参数的方法的技术问题。
发明内容
根据方面,描述一种用于从I个混合音频信号估计J个音频源的源参数的方法,其中I,J>1。所述混合音频信号通常包含多个帧。所述I个混合音频信号可表示为频域中的混合音频矩阵且所述音频源可表示为所述频域中的源矩阵。特定来说,可使用时域到频域变换(例如短期傅里叶变换)将所述混合音频信号从所述时域变换到所述频域。
所述方法包含对于帧n更新非混合矩阵,所述非混合矩阵适应于提供从所述混合音频矩阵对所述源矩阵的估计。基于混合矩阵更新所述非混合矩阵,所述混合矩阵适应于提供从所述源矩阵对所述混合音频矩阵的估计。作为所述更新步骤的结果,获得(经更新)非混合矩阵。
特定来说,可使用Sfn=ΩfnXfn确定所述帧n及所述频域的频段f的所述源矩阵的估计。此外,可基于Xfn=AfnSfn确定所述帧n及所述频段f的所述混合音频矩阵的估计。在上述公式中,Sfn是所述源矩阵(的估计),Ωfn是所述非混合矩阵,Afn是所述混合矩阵,且Xfn是所述混合音频矩阵。
此外,所述方法包含基于所述(经更新)非混合矩阵且基于所述帧n的所述I个混合音频信号更新所述混合矩阵。
另外,所述方法包含迭代所述更新步骤直到满足整体收敛准则。换句话说,可使用所述先前更新的混合矩阵更新所述非混合矩阵,且可使用所述先前更新的非混合矩阵更新所述混合矩阵。可针对多次迭代执行这些更新步骤直到满足所述整体收敛准则。所述整体收敛准则可取决于两次连续迭代之间的所述混合矩阵的变化程度。特定来说,一旦两次连续迭代之间的所述混合矩阵的所述变化程度等于或小于预定阈值,就可终止所述迭代更新程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780028437.8/2.html,转载请声明来源钻瓜专利网。