[发明专利]音频定位系统的灵敏度模式在审
申请号: | 202310033633.1 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116416977A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | S·莫赛耶波卡斯卡里 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22;G10L25/87;G10L21/0208;G10L15/28 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 董婕;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 定位 系统 灵敏度 模式 | ||
1.一种操作级联音频定位系统的高功率子系统的方法,包括:
使用所述高功率子系统的高功率触发器的一个或多个检测模型来检测目标声音活动是否包括在一个或多个音频流中,其中:
当所述级联音频定位系统处于常规模式时,所述一个或多个检测模型与超参数的第一集合相关联;以及
当所述级联音频定位系统处于灵敏度模式时,所述一个或多个检测模型与超参数的第二集合相关联;以及
响应于在所述目标声音活动中检测所述一个或多个音频流,提供一个或多个经处理的音频流中的至少一个以用于进一步处理。
2.根据权利要求1所述的方法,还包括:
以所述常规模式操作所述级联音频定位系统,其中用于所述一个或多个检测模型的所述超参数的第一集合用于检测所述目标声音活动是否包括在所述一个或多个音频流中;
使用所述超参数的第一集合确定在第一时间量内在所述一个或多个音频流中检测到所述目标声音活动的第一次数;
如果将使用所述超参数的第二集合而不是如果将使用所述超参数的第一集合,则确定在所述第一时间量内将在所述一个或多个音频流中检测到所述目标声音活动的第二次数;以及
基于所述第一次数和所述第二次数将所述级联音频定位系统从所述常规模式切换到所述灵敏度模式,其中用于所述一个或多个检测模型的所述超参数的第二集合用于检测所述目标声音活动是否包括在所述一个或多个音频流中。
3.根据权利要求2所述的方法,还包括:
以所述灵敏度模式操作所述级联音频定位系统;
确定在第二时间量内在所述一个或多个音频流中检测到所述目标声音活动的次数;以及
基于所述次数将所述级联音频定位系统从所述灵敏度模式切换到所述常规模式。
4.根据权利要求1所述的方法,其中使用所述一个或多个检测模型来检测所述目标声音活动是否包括在所述一个或多个音频流中包括:
使用第一检测模型来生成所述一个或多个音频流包括所述目标声音活动的第一概率;以及
将所述第一概率与第一检测阈值进行比较,其中检测所述一个或多个音频流中的所述目标声音活动是基于所述比较。
5.根据权利要求4所述的方法,还包括在以所述常规模式和所述灵敏度模式操作的所述级联音频定位系统之间进行切换,其中:
在以所述常规模式和所述灵敏度模式操作的所述级联音频定位系统之间进行切换包括在使用所述第一检测阈值和使用第二检测阈值进行与所述第一概率的所述比较之间进行切换;
所述超参数的第一集合包括所述第一检测阈值;以及
所述超参数的第二集合包括所述第二检测阈值。
6.根据权利要求4所述的方法,其中使用所述一个或多个检测模型来检测所述目标声音活动是否包括在所述一个或多个音频流中包括:
使用一个或多个附加检测模型,其中所述一个或多个附加检测模型中的每一个用于生成所述一个或多个音频流包括所述目标声音活动的附加概率;
对于每个附加概率,将所述附加概率和与所述附加检测模型相关联的检测阈值进行比较,以由相关联的检测模型检测所述目标声音活动是否包括在所述一个或多个音频流中;
对检测所述目标声音活动包括在所述一个或多个音频流中的检测模型的数量进行计数;以及
将所述数量与第一集成阈值进行比较,其中检测所述一个或多个音频流中的所述目标声音活动是基于所述数量与所述第一集成阈值的所述比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310033633.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:级联音频检出系统
- 下一篇:一种变电站一次设备巡检系统、方法、终端及存储介质