[发明专利]音频定位系统的灵敏度模式在审
申请号: | 202310033633.1 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116416977A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | S·莫赛耶波卡斯卡里 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22;G10L25/87;G10L21/0208;G10L15/28 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 董婕;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 定位 系统 灵敏度 模式 | ||
描述了一种被配置用于包括常规模式和灵敏度模式的各种操作模式的音频定位系统。示例级联音频定位系统可以包括高功率子系统,该高功率子系统包括高功率触发器和传递模块。该高功率触发器包括用于检测目标声音活动是否包括在一个或多个音频流中的一个或多个检测模型。当级联音频定位系统处于常规模式时,一个或多个检测模型与超参数的第一集合相关联,并且当级联音频定位系统处于灵敏度模式时,一个或多个检测模型与超参数的第二集合相关联。传递模块响应于高功率触发器在一个或多个音频流中检测目标声音活动而提供一个或多个经处理的音频流中的至少一个以用于进一步处理。
技术领域
本实施例一般涉及音频信号处理,并且更具体地,例如,涉及用于识别音频流中的特定音频事件的级联音频定位系统。
背景技术
音频控制设备,诸如智能扬声器、移动电话、用于各种电子设备(例如,汽车、电器等)的话音使能接口、以及各种物联网(IoT)设备近年来已经变得流行。这些设备通常被配置为通过一个或多个麦克风感测环境声音,然后处理所接收的音频输入以检测要用于使得执行一个或多个操作的一个或多个话音命令或其他音频事件(诸如智能扬声器调整音量或停止回放、移动电话执行互联网搜索、或者智能电视调谐到特定节目)。为了节省功率,许多音频控制设备在不活动时进入低功率模式。然而,当设备处于低功率模式时,用于检测一个或多个口述关键词(诸如Siri、Alexa或Google)或其他音频事件的设备的音频处理部分以始终开启的方式保持处于活动模式。如果音频处理部分检测到关键词或其他音频事件,则设备从低功率模式唤醒到活动模式中以使得能够进一步处理一个或多个后续话音命令或其他音频事件,以便执行与话音命令或音频事件相关联的一个或多个操作。
因为许多音频控制设备是电池有限的或以其他方式具有低功耗(诸如许多IoT设备),所以需要降低设备的音频处理部分的功耗以检测口述关键词或其他音频事件,同时维持期望的性能水平。
发明内容
提供本发明内容是为了以简化的形式介绍下面在详细描述中进一步描述的概念的选择。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在限制所要求保护的主题的范围。
本文中公开的系统和方法包括级联音频定位系统,其包括被设计为在级联过程中顺序操作以降低操作期间的功耗的多个模块。级联音频定位系统中的初始模块比级联音频定位系统中的稍后的模块消耗更少的功率,其中稍后的模块实现比初始模块更期望的性能水平。级联各模块使得仅基于先前模块的性能使用稍后的模块降低了功耗,而不牺牲整体性能。
本公开的一些方面涉及操作级联音频定位系统的示例方法。该方法包括由级联音频定位系统的第一模块从一个或多个音频流接收音频流。该方法还包括由第一模块处理音频流以检测音频流中的第一目标声音活动。该方法还包括响应于检测音频流中的第一目标声音活动,由第一模块提供第一信号。该方法还包括响应于由第一模块提供第一信号,由高功率子系统接收一个或多个音频流,并由高功率子系统处理一个或多个音频流以检测一个或多个音频流中的第二目标声音活动。
在一些实现方式中,所述方法还包括响应于由所述第一模块提供的第一信号,将所述高功率子系统从低功率模式切换到活动模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310033633.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:级联音频检出系统
- 下一篇:一种变电站一次设备巡检系统、方法、终端及存储介质