[发明专利]音频信号的自适应主体-环境分解有效
申请号: | 200980111808.4 | 申请日: | 2009-03-31 |
公开(公告)号: | CN101981811A | 公开(公告)日: | 2011-02-23 |
发明(设计)人: | 迈克尔·M·古德温 | 申请(专利权)人: | 创新科技有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G10L19/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 王安武;南霆 |
地址: | 新加坡*** | 国省代码: | 新加坡;SG |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 自适应 主体 环境 分解 | ||
相关申请的交叉引用
本申请要求2008年3月31日提交的编号为61/041,181(代理案卷CLIP300PRV)并且标题为“Adaptive Primary-Ambient Decomposition of Audio Signals”的美国临时专利申请的权限,并且是2008年3月31日提交的编号为12/048,156(代理案卷CLIP189US)且标题为“Vector-Space Methods for Primary-Ambient Decomposition of Stereo Audio Signals”的美国专利申请的部分延续,其要求2007年3月13日提交的编号为60/894,650(代理案卷CLIP 189PRV)且标题为“Vector-Space Methods for Primary-Ambient Decomposition of Stereo Audio Signals”的美国临时专利申请的权限,并且其是2007年5月17日提交的编号为11/750,300(代理案卷CLIP159US)且标题为“Spatial Audio Coding Based on Universal Spatial Cues”美国专利申请,其要求2006年5月17日提交的编号为60/747,532(代理案卷CLIP159PRV)的美国临时专利申请的权限,其全部公开内容通过引用结合于此。
技术领域
本发明涉及音频信号处理技术。更具体地,本发明涉及用于将音频信号分解成主体组分和环境组分的方法。
背景技术
主体-环境分解算法将混响(以及扩散的,不聚焦的源)从立体声或者多声道音频信号的主相干源分离。这有益于音频增强(诸如增加或减少乐曲的“鲜明感(liveliness)”),上混(upmix)(例如,其中环境信息被用来产生合成环绕声信号(synthetic surround signals)),以及空间音频编码(其中对于主体信号内容和环境信号内容需要不同的方法)。
目前的方法通过把实值乘数应用到原始声道信号来确定每个音频声道的环境组分,使得产生的每个声道的主体组分和环境组分同相。遗憾的是,这些技术在音频重现中有时会导致假象。这些假象包括主体组分进入环境组分的“泄露”等。需要改进的主体-环境分解技术。
发明内容
本发明描述了如下技术:该技术可用于避免如相干源进入估计的环境组分的“泄露”这样的假象。本发明提供了用于将立体声音频信号或者多声道音频信号分解成主体组分和环境组分的方法。还描述了用于增强分解的后处理方法。
本发明提供了用于把立体声音频信号分成主体组分和环境组分的方法。根据一些实施例,执行了向量空间主体-环境分解。得到了主体组分和环境组分,使得主体组分和环境组分的和等于原始信号并且组分之间满足不同的预期的正交条件。在优选的实施例中,输入音频信号被过滤成子带;这些子带信号然后被作为向量处理并且利用向量空间方法被分解成主体组分和环境组分。这些实施例的优势是与先前描述的方法相比,要求更少的算法参数的调谐。
当前发明的实施例可以在时域音频信号上直接操作。然而,在优选的实施例中,进入的立体声音频信号首先被从时域表示变换为频域表示或者子带表示。用来变换到频域的一种方法,一般称为短时傅里叶变换(STFT),立体声信号的每个声道被窗口框起来以产生声音的帧或段,并且在窗口信号帧上执行傅里叶变换以产生每一帧中信号内容的频域表示。窗函数从集中于全部时域信号的当前处理中撤出而针对时域信号的短时区间。帧以固定的偏移量(称为间隔(hop size))隔开。间隔确定了帧之间的交叠。STFT的应用产生经变换的信号在多个频率点或子带上的分配。对每个信号窗口或帧,每个点包含该帧中的声道信号的幅度和相位值;分析每个具体点的时间序列(对应于先前的信号窗口的序列),以将针对当前时间的各个点的信号内容分离成主体组分和环境组分。这种主体组分和环境组分的比例分配基于向量空间操作。逆变换被应用于主体和环境信号内容以产生各个主体和环境时域信号。
在一些实施例中,各个声道信号被分解成主体组分和环境组分以满足经选择的正交约束。音频信号和信号组分被作为向量处理以使能向量和矩阵数学的应用以及便于说明不同实施例的操作的图示的使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新科技有限公司,未经创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980111808.4/2.html,转载请声明来源钻瓜专利网。