[发明专利]用于音频处理的方法和系统及计算机可读存储介质有效

专利信息
申请号: 201680004787.6 申请日: 2016-01-06
公开(公告)号: CN107112012B 公开(公告)日: 2020-11-20
发明(设计)人: 戴维·P·罗苏姆;N·D·沃伦 申请(专利权)人: 美商楼氏电子有限公司
主分类号: G10L15/20 分类号: G10L15/20
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 吕俊刚;杨薇
地址: 美国伊*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 音频 处理 方法 系统 计算机 可读 存储 介质
【说明书】:

提供了用于音频处理的方法和系统及计算机可读存储介质。一种示例方法包括以下步骤:接收表示由数字麦克风捕捉的至少一个声音的第一声信号。第一声信号包括以第一时钟频率传输的缓冲数据。数字麦克风可以提供语音活动检测。示例方法还包括以下步骤:接收表示由第二麦克风捕捉的至少一个声音的至少一个第二声信号,至少一个第二声信号包括实时数据。向可以包括噪声抑制和关键词检测的音频处理系统提供第一和第二声信号。缓冲部分可以以更高的第二时钟频率被发送,以消除第一声信号与第二声信号的延迟。提供信号还可以包括延迟第二声信号。

相关申请的交叉引用

本申请要求2015年1月7日提交的第62/100758号美国临时专利申请的权益。前面提及的申请的主题通过引用被结合于此,用于所有目的。

技术领域

本申请总体涉及音频处理,更具体地涉及用于利用数字麦克风用于低功率关键词检测和噪声抑制的系统和方法。

背景技术

关键词检测的典型方法是三阶段处理。第一阶段是发声检测。最初,极低功率“永远在线”实施方案连续监测环境声并(通常通过检测人发声)确定人是否开始说出可能关键词。当检测到可能关键词发声时,第二阶段开始。

第二阶段执行关键词识别。因为该操作在计算上比发声检测更密集,所以它消耗更多的功率。当完成发出声音的检查(例如,关键词识别)时,结果可以是关键词匹配(在该情况下,将进入第三阶段)或不匹配(在该情况下,第一最低功率阶段的操作重新开始)二者之一。

第三阶段被用于继使用自动语音识别(ASR)进行关键词识别之后分析任意语音。该第三阶段是计算上非常密集的处理,因此可以从对包括语音的音频的一部分的信噪比(SNR)的改进中大大受益。SNR通常使用噪声抑制(NS)信号处理来优化,该处理可能要求从多个麦克风获得音频输入。

数字麦克风(DMIC)的使用是众所周知的。DMIC通常包括信号处理部。数字信号处理器(DSP)通常用于执行用于检测关键词的计算。使某一形式的数字信号处理器(DSP)对与DMIC本身的信号处理部相同的集成电路(芯片)执行关键词检测计算可以具有系统功率益处。例如,在处于第一阶段时,DMIC可以根据内部振荡器操作,由此节省向DMIC供给外部时钟的功率和向外部DSP装置传输DMIC数据输出(通常为脉冲密度调制(PDM)信号)的功率。

还已知在DMIC上实施关键词识别的随后阶段对于最低功率或系统成本可能不是最佳。关键词识别的随后阶段在计算上是密集的,由此消耗大量的动态功率和管芯面积。然而,DMIC信号处理芯片通常使用与最佳可用数字处理相比具有每栅极或存储位显著更高的动态功率和更大的面积的工艺几何结构来实现。

找到利用在DMIC中实施关键词识别的第一阶段的潜在功率节省的最佳实施方案可能由于冲突的要求而具有挑战性。为了优化功率,DMIC以“永远在线”的独立方式操作,而当尚未检测到发声时不向外部装置传输音频数据。当检测到发声时,DMIC需要向外部装置提供指示该情况的信号。与该情况的发生同时或继其之后,DMIC需要开始向执行随后阶段的外部装置提供音频数据。最佳地,需要音频数据接口满足以下要求:发送与显著先于发声检测的时间对应的音频数据,以外部提供的时钟(采样)速率发送实时音频数据,并且简化多麦克风噪声抑制处理。另外,与针对实施关键词识别的第一阶段的DMIC的实时音频数据关联的时延需要与针对传统DMIC的延迟大致相同,接口需要与现有接口可兼容,接口需要在与内部振荡器一起操作的同时指示所使用的时钟(采样)速率,并且没有音频漏码会发生。

具有实施关键词识别的第一阶段的DMIC的接口很大程度上由于呈现显著在发声检测之前缓冲的音频数据的要求而导致实施可能具有挑战性。该缓冲的音频数据之前以由内部振荡器确定的采样速率来获取。因此,在将缓冲的音频数据作为单个连续音频流的一部分连同实时音频数据一起提供时,可能难以使得该实时音频数据具有与传统DMIC中相同的时延,或者可能难以使用传统多麦克风噪声抑制技术。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美商楼氏电子有限公司,未经美商楼氏电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201680004787.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top