[发明专利]用于信号传输控制的方法和系统有效

专利信息
申请号: 201210080977.X 申请日: 2012-03-23
公开(公告)号: CN103325386A 公开(公告)日: 2013-09-25
发明(设计)人: 格伦·N·迪金森;双志伟;大卫·古纳万;孙学京 申请(专利权)人: 杜比实验室特许公司
主分类号: G10L25/78 分类号: G10L25/78
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杜诚;李春晖
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 信号 传输 控制 方法 系统
【说明书】:

技术领域

发明一般涉及音频信号处理。更具体地,本发明的实施例涉及信号传输控制。

背景技术

语音活动检测(VAD)是用于确定在含有语音与噪声的混合的信号中存在语音的二值或概率指示的技术。通常,语音活动检测的性能基于分类或检测的准确性。研究工作的动机是使用语音活动检测算法改善声音识别的性能或者对在受益于断续传输手段的系统中传输信号的判决进行控制。语音活动检测还用于控制信号处理功能,信号处理功能如噪声估计、自适应回波和特定算法调节,如噪声抑制系统中对增益系数的滤波。

语音活动检测的输出可以直接用于随后的控制或者元数据,并且/或者可以用于控制对实时音频信号起作用的音频处理算法的性质。

语音活动检测的一种感兴趣的特别应用是在传输控制领域。对于在无语音活动期间端点可以使传输停止或者可以发送数据速率降低了的信号的通信系统,语音活动检测器的设计和性能对于系统的感知质量是关键的。这样的检测器必须最终进行二值判决并且会遇到下述基本问题:为了实现低时延,在可以在短时间帧上观察到的许多特征中,存在有基本交叠的声音和噪声的特征。由此,这样的检测器必须经常面对在误报泛滥与由于不正确的判决而可能丢失期望的声音之间的权衡。低时延、灵敏度和特异度的相抵触的要求不具有完全最优的解决方案,或者至少产生可操作的前景,其中,系统的效率或最优性取决于应用以及预期的输入信号。

发明内容

接收或访问具有块或帧的时间序列的音频信号。两个或更多特征被确定为合起来表征先前在相对于当前时间点最近的时间段内已经处理的顺序音频块或帧中的两个或更多个。特征确定超过特异度标准,并且相对于最近处理的音频块或帧被延迟。在音频信号中检测语音活动的指示。语音活动检测(VAD)基于一个判决,该判决超过预设的灵敏度阈值并且在一个时间段上计算而得,该时间段相对于每个所述音频信号块或帧的时长而言是短的。VAD判决涉及当前音频信号块或帧的一个或更多个特征。高灵敏度短期VAD和最近高特异度音频块或帧特征确定与状态相关信息相组合。状态相关信息基于一个或更多个先前计算的特征确定的历史。先前计算的特征确定的历史收集自最近高特异度音频块或帧特征确定时间段之前的时间上确定的多个特征。基于组合输出有关音频信号的开始或终止的判决,或与之相关的增益。

以下将参照附图详细描述本发明的另外的特征和优点以及本发明的各种实施例的结构和操作。注意的是本发明并不限于此处所描述的具体实施例。这些实施例仅为了说明而被呈现在此。基于此处所含有的教示,其他的实施例对本领域技术人员会是显然的。

附图说明

在附图的各图中,以示例性和非限制性的方式对本发明进行阐释,在附图中,类似的附图标记指代类似的元件,其中:

图1是图示根据本发明一个实施例的示例设备的框图;

图2是图示根据本发明一个实施例的示例方法的流程图;

图3是图示根据本发明一个实施例的示例设备的框图;

图4是针对控制或组合逻辑的一个具体实施例的示意信号图;

图5A和图5B描述了一个流程图,该流程图图示了根据本发明一个实施例的用于产生内部烦扰水平(NuisanceLevel)和控制传输标志的逻辑;

图6是图示在处理包含与打字(烦扰(nuisance))交织的期望话音分段的音频分段发生的内部信号的曲线图;

图7是图示根据本发明一个实施例的示例设备的框图;

图8是示出根据本发明实施例的用于执行信号传输控制的示例设备的框图;

图9是示出根据本发明实施例的执行信号传输控制的示例方法的流程图;而

图10是示出用于实施本发明实施例的示例性系统的框图。

具体实施方式

下面参考附图描述本发明实施例。应注意,为清楚起见,在附图和描述中省略了关于本领域技术人员已知但是与本发明无关的组件和过程的陈述和描述。

本领域的技术人员可以理解,本发明的各方面可以被实施为系统、装置(例如蜂窝电话、便携媒体播放器、个人计算机、电视机顶盒、或数字录像机、或任意其它媒体播放器)、方法或计算机程序产品。因此,本发明的各方面可以采取以下形式:完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)或组合软件部分与硬件部分的实施例,本文可以一般地称之为“电路”、“模块”或“系统”。此外,本发明的各方面可以采取体现为一个或多个计算机可读介质的计算机程序产品的形式,该计算机可读介质上体现有计算机可读程序代码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210080977.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top