[发明专利]电子设备、方法和计算机程序在审
申请号: | 202080076969.0 | 申请日: | 2020-11-03 |
公开(公告)号: | CN114631142A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 弗兰克·吉龙;埃尔克·舍希特勒 | 申请(专利权)人: | 索尼集团公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/03;H04S1/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 沈丹阳 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子设备 方法 计算机 程序 | ||
一种包括电路的电子设备,所述电路被配置为分析立体声或多声道源分离的结果,以确定一个或多个时变参数,并基于所述一个或多个时变参数创建空间动态音频对象。
技术领域
本公开总体上涉及音频处理领域,具体涉及用于源分离和混合的设备、方法和计算机程序。
背景技术
有许多音频内容是可用的,例如,以光盘(CD)、磁带、可以从互联网下载的音频数据文件的形式,但是也可以以例如存储在数字视频盘等上的视频的音轨的形式。通常,音频内容已经混合,例如,对于单声道或立体声设置,而没有保留来自已经用于音频内容制作的原始音频源的原始音频源信号。然而,存在设想混合音频内容的情况或应用。
随着面向空间音频对象的系统(例如,DolbyAtmos、DTS-X或最近的Sony 360RA)的出现,需要找到一些方法来欣赏大量的旧版内容,这些内容最初没有与考虑到的面向音频的对象的概念混合在一起。一些现有的上混系统试图提取一些基于频谱的特征,或者添加一些外部效果,以在空间上呈现旧版内容。因此,尽管通常存在用于混合音频内容的技术,但是通常期望改进用于混合音频内容的设备和方法。
发明内容
根据第一方面,本公开提供一种包括电路的电子设备,所述电路被配置为分析立体声或多声道源分离的结果,以确定一个或多个时变参数,并基于所述一个或多个时变参数创建空间动态音频对象。
根据另一方面,本公开提供了一种方法,包括分析立体声或多声道源分离的结果,以确定一个或多个时变参数,并基于所述一个或多个时变参数创建空间动态音频对象。
在从属权利要求、以下描述和附图中阐述了进一步的方面。
附图说明
参考附图,通过示例来解释实施例,其中:
图1示意性地示出了通过盲源分离(BSS)(例如,音乐源分离(MSS))进行音频上混/再混的一般方法;
图2示意性地示出了分离源的自动时间相关的空间上混的处理,其中,基于计算的边中比来执行放置单极;
图3示出了图2中描述的分离源的空间上混的处理的详细示例性实施例;
图4a示意性地描述了对原始立体声信号执行的如图3中所描述的节拍检测过程的实施例;
图4b示意性地描述了在图3中描述的分离源的空间上混过程中执行的节拍检测过程的实施例;
图5a示意性地描述了在图3中描述的分离源的空间上混过程中执行的边中比计算的实施例;
图5b示出了图5a中描述的边中比计算的示例性结果;
图5c示意性地描述了可以在图5a中描述的分离源的边中比计算过程期间执行的静音抑制过程的实施例;
图6a示意性地描述了在图3中描述的分离源的空间上混过程中执行的分割过程的实施例;
图6b示出了包括在参考图6a描述的分割过程中的每拍边中比的聚类过程;
图6c提供了可以应用于分割分离源的聚类过程的实施例;
图6d示出了在图6a的参考下描述的片段中聚类的每拍边中比;
图7a示意性地示出了时间平滑过程,其中,在分离源的片段上对分离源的边中比rat进行平均;
图7b示出了平滑过程的示例,由图6a的分割过程识别的第一片段S1与平滑的边中比相关联;
图8a示出了位置映射的示例性实施例,该位置映射确定用于呈现分离源的单极的位置;
图8b示出了位置映射的另一示例性实施例,该位置映射确定用于呈现分离源的单极的位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼集团公司,未经索尼集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080076969.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:非空间测量结果校准方法及相关系统和设备
- 下一篇:用于陶瓷刀片的包装