[发明专利]自动生成用于音频占优性效果的元数据有效
申请号: | 201080045292.0 | 申请日: | 2010-10-05 |
公开(公告)号: | CN102576562A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | J·C·瑞德米勒;R·拉达克里希南;H·缪施 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G11B27/28 | 分类号: | G11B27/28;G11B27/32;G10L11/06;G10L19/00;G11B27/11;H04N5/60;G11B27/031;G11B27/10 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 康建忠 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 用于 音频 占优 效果 数据 | ||
相关申请的交叉引用
本申请要求于2009年10月9日提交的美国临时专利申请No.61/250,457的优先权,通过引用将其全文合并到此。
技术领域
本发明总体上涉及占优性效果。更具体地说,本发明实施例涉及自动生成用于音频占优性效果的元数据。
背景技术
常常要求广播工作室传送与音频和/或视频节目关联的两个或更多个音频流。例如,主要音频流可以包括节目的主要对话、音乐以及效果,辅助音频流可以包括描述性音频(例如,将用于视觉受损观众的语音)。
音频流可以总是有效(active)或可以并非总是有效。例如,包括描述性音频的辅助音频流可以是在设置并且描述节目中的场景(或场景改变)的时段期间有效的。然而,如果辅助音频流在与主要音频流相同的时间是有效的,则辅助音频流可能位于主要音频流上而用户听不清。
此部分中描述的方法是可以实行的方法,但不一定是先前已经构思或实行的方法。因此,除非另外指示,否则不应假设该部分中描述的任何方法仅由于它们被包括在该部分中而限制为现有技术。相似地,对于一个或多个方法所指出的问题不应基于该部分而假设在任何现有技术中已经识别,除非另外指示。
附图说明
在附图中通过示例的方式而不是限制的方式示出本发明,并且其中,相似标号指代相似元件,并且其中:
图1描述根据实施例的元数据生成单元的示例;
图2描述用于基于自动生成的元数据而产生占优性效果的示例方法;
图3A-图3B示出根据实施例的音频流信号的示例;
图4描述示出在其上可以实现实施例的计算机系统的框图;以及
图5描述根据实施例的示例IC设备。
具体实施方式
在此描述的示例实施例涉及自动生成音频占优性效果。在以下描述中,为了解释,阐述大量细节以提供本发明的透彻理解。然而,本领域技术人员应理解,在没有这些具体细节的情况下仍可以实现本发明。在其它情况下,以框图形式示出公知结构和设备,以免使本发明模糊。
在此根据以下纲要描述示例实施例:
1.0普通概述
2.0架构和功能概述
3.0示例流程图
4.0实现机制-硬件概述
5.0等同物、扩展、替代和其它
1.0普通概述
在可能的实施例中,自动生成包括用于一个或多个音频流以产生占优性效果的增益值的元数据。自动生成所述元数据可以包括:接收第一音频流和第二音频流,计算用于所述第一音频流和所述第二音频流中的至少一个以产生所述第二音频流超过所述第一音频流的占优性效果的一组增益,以及生成包括用于所述第一音频流和所述第二音频流中的至少一个的该组增益的元数据。
在可能的实施例中,基于所述第二音频流超过所述第一音频流的占优性准则而计算该组增益。所述占优性准则的示例包括所述第一音频流与所述第二音频流之间的响度比率、以及所述第一音频流与所述第二音频流之间的功率比率。计算该组增益可以包括:推导所述第一音频流和所述第二音频流中的至少一个的响度值。所述占优性准则可以包括所述第二音频流的清晰度准则,其中,对于一个或多个音频流计算该组增益,以满足所述第二音频流的清晰度准则。所述清晰度准则可以是语音清晰度值,例如语音清晰度指标。所述占优性准则可以基于频率子带而变化。
在可能实施例中,基于所述第一音频流包括语音内容还是非语音内容而计算该组增益。该组增益可以根据与所述第一音频流包括语音内容还是非语音内容相关联的置信度水平而变化。可以对于不同频率子带计算不同的增益组。在实施例中,可以在如下这样的约束下推导该组增益:即在应用对应的一组增益之后,组合的第一音频流和第二音频流的响度不超过第一音频流和第二音频流的响度值中的较大者。
在可能实施例中,当多个音频流有效时,可以识别交叠信号时间间隔。可以仅当多个音频流有效时计算该组增益。可以当仅单个音频流有效时使用中性或其它默认增益值。
本发明其它实施例可以包括具有用于执行上述步骤的功能的系统、包括当被执行时实行上述步骤的指令的计算机可读存储介质、以及用于执行上述步骤的装置。
2.0架构和功能概述
在此描述与自动生成音频占优性效果有关的可能实施例的示例。在以下描述中,为了解释,阐述大量细节以提供本发明的透彻理解。然而,应理解,在没有这些具体细节的情况下仍可以实现本发明。在其它情况下,不详尽地描述公知结构和设备,以避免使本发明闭塞、模糊或混乱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080045292.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可固化树脂组合物及其固化物
- 下一篇:制备氘代芳族化合物的方法