[发明专利]级联音频检出系统在审
申请号: | 202310033628.0 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116416979A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | S·莫赛耶波卡斯卡里;邱洪;A·普亚 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G06N20/00;G10L15/22;G10L21/0208;G10L21/0216;G10L15/16;G10L15/06;G10L25/30;G10L25/51 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 董婕;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 级联 音频 检出 系统 | ||
1.一种操作级联音频检出系统的方法,包括:
由所述级联音频检出系统的第一模块从一个或多个音频流接收音频流;
由所述第一模块处理所述音频流以检测所述音频流中的第一目标声音活动;
响应于检测到所述音频流中的所述第一目标声音活动,由所述第一模块提供第一信号;
响应于由所述第一模块提供的所述第一信号:
由高功率子系统接收所述一个或多个音频流;以及
由所述高功率子系统处理所述一个或多个音频流以检测所述一个或多个音频流中的第二目标声音活动。
2.根据权利要求1所述的方法,还包括响应于由所述第一模块提供的所述第一信号,将所述高功率子系统从低功率模式切换到活动模式。
3.根据权利要求1所述的方法,其中所述第一模块包括以下之一:
模拟话音活动检测器VAD,其中所述音频流包括模拟音频流;
数字VAD,其中所述音频流包括从所述模拟音频流转换的数字音频帧流;或者
低功率触发器,其中所述音频流包括从所述模拟音频流转换的所述数字音频帧流。
4.根据权利要求3所述的方法,其中所述低功率触发器包括用于识别所述音频流中的所述第一目标声音活动的一个或多个检测模型的第一集合,其中:
所述一个或多个检测模型的第一集合与用于所述低功率触发器的一个或多个超参数的第一集合相关联;以及
所述第一目标声音活动包括所述音频流中的一个或多个口头关键词。
5.根据权利要求4所述的方法,其中所述高功率子系统包括用于检测所述一个或多个音频流中的第二目标声音活动的高功率触发器,其中:
所述高功率触发器包括用于识别所述第二目标声音活动的一个或多个检测模型的第二集合;所述一个或多个检测模型的第二集合与用于所述高功率触发器的一个或多个超参数的第二集合相关联;以及
所述第二目标声音活动与所述第一目标声音活动相同。
6.根据权利要求5所述的方法,其中:
用于所述高功率触发器的所述一个或多个检测模型的第二集合包括所述一个或多个检测模型的第一集合;以及
与用于所述高功率触发器的所述一个或多个检测模型的第一集合相关联的一个或多个超参数的集合不同于所述一个或多个超参数的第一集合。
7.根据权利要求5所述的方法,其中所述一个或多个检测模型的第一集合和所述一个或多个检测模型的第二集合被存储在用于所述低功率触发器和所述高功率触发器的共享存储器中。
8.根据权利要求1所述的方法,还包括:
由所述高功率子系统接收与所述一个或多个音频流相关联的参考信号,其中由所述高功率子系统处理所述一个或多个音频流包括:
检测所述第二目标声音活动是否被包括在所述参考信号中;以及
响应于在所述参考信号中检测到所述第二目标声音活动,防止在所述一个或多个音频流中检测所述第二目标声音活动。
9.根据权利要求1所述的方法,其中由所述高功率子系统处理所述一个或多个音频流包括:基于参考信号对所述一个或多个音频流执行回波消除以生成一个或多个经回波消除的音频流;以及
检测所述第二目标声音活动是否包括在所述一个或多个经回波消除的音频流中。
10.根据权利要求9所述的方法,其中由所述高功率子系统处理所述一个或多个音频流包括:对所述一个或多个经回波消除的音频流执行多声道降噪MCNR以生成一个或多个MCNR输出;以及
检测所述第二目标声音活动是否被包括在所述一个或多个MCNR输出中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310033628.0/1.html,转载请声明来源钻瓜专利网。