[发明专利]在包括至少一个人工声源的环境中识别由真实声源产生的至少一种自然发出的声音的方法、相应装置、计算机程序产品和计算机可读载体介质在审
申请号: | 202080082027.3 | 申请日: | 2020-11-04 |
公开(公告)号: | CN114787919A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 亨克·海宁;菲利普·吉尔伯顿;艾瑞克·戈蒂埃 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G10L25/57 | 分类号: | G10L25/57;G10L25/51;G10L17/26;G08B13/16;G08B1/08;G08B29/18 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 张敏 |
地址: | 法国瑟松*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 至少 一个 人工 声源 环境 识别 真实 产生 一种 自然 发出 声音 方法 相应 装置 | ||
本公开涉及一种用于识别至少一种自然发出的声音的方法,该声音由包括至少一个人工声源(ASSr)的环境中的真实声源产生。所述方法由音频识别设备实现,并且包括:同时获得(11)来自位于所述环境中的第一麦克风(MIC)的第一音频信号和来自与所述至少一个人工声源相关联的音频采集设备(AAD)的第二音频信号;分析(12)所述第一音频信号,传递与在所述第一音频信号中识别的声音相对应的声音类别的第一列表(L1);分析(13)所述第二音频信号,传递与在所述第二音频信号中识别的声音相对应的声音类别的第二列表(L2);传递(14)声音类别的第三列表(L3),其仅包括:被包括在所述声音类别的第一列表(L1)中、但不被包括在所述声音类别的第二列表(L2)中的声音类别。
技术领域
本公开总体涉及音频识别系统的领域。更具体地,本公开涉及允许将由人工声源(例如电视机、无线电接收器等)产生的人工声音与由真实源自然产生的相同类型的声音区分开来的技术。
背景技术
本部分旨在向读者介绍技术的各个方面,这些方面可能与以下描述和/或要求保护的本公开的各个方面有关。该讨论被认为有助于为读者提供背景信息以促进更好地理解本公开的各个方面。因此,应该理解,这些陈述是从这个角度来理解的,而不是承认现有技术。
在音频识别领域,一些音频识别系统被专门设计用于识别诸如枪声、婴儿哭声、玻璃破碎等之类的声音。这些系统与自动语音识别系统不同,因为它们不是被设计用于识别语音而是仅识别声音,这些系统可用于多种应用,例如但不限于家庭安全。
这些音频识别系统面临的问题之一是难以区分来自可能存在于实现这些系统的环境中的各种电子设备(如电视机、无线电接收器等)的扬声器的人工发出的声音与自然真实发出的声音。例如,在家庭安全系统领域,如果在家中或周围检测到枪声或玻璃破碎声,则应通知不在家的用户,但前提是检测到的声音是“真实的”声音,即是否真的开枪了或玻璃实际上被打碎了。另一方面,例如,如果检测到的声音是电视上播放的电影的音轨的一部分并且当前正在被另一个家庭成员观看,则不应该通知用户。目前,许多现有的音频识别系统在区分真实声音(即自然发出的声音)与装置产生的声音(即人工发出的声音)时效率不高。在家庭安全领域,由此产生的声音事件的错误分类导致生成大量通知终端用户的“误报”,最后终端用户可能对此类安全系统失去信心。
为了尝试解决这些缺点,一些现有的解决方案依赖于低电平信号处理技术来处理由一些麦克风捕获的音频信号,目的是消除或至少减少处理后的输出音频信号中的人工声音。更具体地,减法器电路用于从由麦克风捕获的主音频信号中减去人工声音,并且所得信号由声音识别引擎处理。这些解决方案的主要问题是,由于声音在环境中存在的物体和/或结构(例如墙壁)上的反射,麦克风捕获真实声音和人工声音之间的不可预测的混合,该混合不仅是幅度方面的而且是相位和潜在回声方面的。因此,麦克风捕获的声音是反射声音和直接声音的复杂叠加。所有这些声音的幅度和相位都是不可预测的,使得减法很难在减法器电路级别正确执行。因此,此类解决方案需要许多参数调整(例如,设置减法器电路的增益适应系数),这些调整高度依赖于环境(例如,房间配置、房间中声源的位置、发出一些人工声音的装置的声功率、麦克风的位置和方向等),最后只能提供较差或混合的结果。
因此,希望提供一种技术,该技术将避免现有技术的这些缺点中的至少一些,并且将特别允许以更准确的方式区分人工发出的声音与自然发出的声音。
发明内容
根据本公开,公开了一种用于识别由包括至少一个人工声源的环境中的真实声源产生的至少一种自然发出的声音的方法。这种方法由音频识别设备实现,并且包括:
-同时获得:
-来自位于所述环境中的第一麦克风的第一音频信号;和
-来自与所述至少一个人工声源相关联的音频采集设备的第二音频信号;
-分析所述第一音频信号,传递与在所述第一音频信号中识别的声音相对应的声音类别的第一列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080082027.3/2.html,转载请声明来源钻瓜专利网。