[发明专利]级联音频检出系统在审
申请号: | 202310033628.0 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116416979A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | S·莫赛耶波卡斯卡里;邱洪;A·普亚 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G06N20/00;G10L15/22;G10L21/0208;G10L21/0216;G10L15/16;G10L15/06;G10L25/30;G10L25/51 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 董婕;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 级联 音频 检出 系统 | ||
用于识别一个或多个音频流中的音频事件的系统和方法包括使用级联音频检出系统(诸如级联关键词检出系统(KWS))来降低功耗,同时保持期望的性能。示例级联音频检出系统可以包括第一模块和高功率子系统。第一模块用于从一个或多个音频流接收音频流,处理音频流以检测音频流中的第一目标声音活动,并且响应于检测到音频流中的第一目标声音活动而提供第一信号。高功率子系统用于(响应于由第一模块提供的第一信号)接收一个或多个音频流并处理一个或多个音频流以检测一个或多个音频流中的第二目标声音活动。
技术领域
本实施例总体上涉及音频信号处理,并且更具体地例如涉及用于识别音频流中的特定音频事件的级联音频检出(spotting)系统。
背景技术
近年来,诸如智能扬声器、移动电话、用于各种电子设备(例如,汽车、电器等)的话音启用的接口、以及各种物联网(IoT)设备之类的音频控制设备已经变得流行。这些设备通常被配置为通过一个或多个麦克风感测环境声音,然后处理所接收的音频输入以检测要用于使一个或多个操作被执行(诸如智能扬声器调整音量或停止回放、移动电话执行互联网搜索、或智能电视调谐到特定节目)的一个或多个话音命令或其他音频事件。为了节省功率,许多音频控制设备在不活动时进入低功率模式。然而,当设备处于低功率模式时,用于检测一个或多个口头关键词(诸如Siri、Alexa、或Google)或其他音频事件的设备的音频处理部分以始终开启的方式保持在活动模式。如果音频处理部分检测到关键词或其他音频事件,则设备从低功率模式唤醒到活动模式,以使得能够进一步处理一个或多个后续话音命令或其他音频事件,以便执行与话音命令或音频事件相关联的一个或多个操作。
因为许多音频控制设备是电池受限的或以其他方式具有低功耗(诸如许多IoT设备),所以需要降低设备的音频处理部分的功耗以检测口头关键词或其他音频事件,同时保持期望的性能水平。
发明内容
提供本发明内容是为了以简化的形式介绍下面在具体实施方式中进一步描述的概念的选择。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在限制所要求保护的主题的范围。
本文公开的系统和方法包括级联音频检出系统,其包括被设计为在级联过程中顺序操作以降低操作期间的功耗的多个模块。级联音频检出系统中的初始模块比级联音频检出系统中的稍后的模块消耗更少的功率,其中稍后的模块实现比初始模块更期望的性能水平。级联模块使得稍后的模块仅基于先前模块的性能来使用降低了功耗而不牺牲整体性能。
本公开的一些方面涉及操作级联音频检出系统的示例方法。该方法包括由级联音频检出系统的第一模块从一个或多个音频流接收音频流。该方法还包括由第一模块处理音频流以检测音频流中的第一目标声音活动。该方法还包括响应于检测到音频流中的第一目标声音活动,由第一模块提供第一信号。该方法还包括响应于第一信号由第一模块提供,由高功率子系统接收一个或多个音频流,并且由高功率子系统处理一个或多个音频流以检测一个或多个音频流中的第二目标声音活动。
在一些实现方式中,该方法还包括响应于第一信号由第一模块提供而将高功率子系统从低功率模式切换到活动模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310033628.0/2.html,转载请声明来源钻瓜专利网。