[发明专利]在包括至少一个人工声源的环境中识别由真实声源产生的至少一种自然发出的声音的方法、相应装置、计算机程序产品和计算机可读载体介质在审
申请号: | 202080082027.3 | 申请日: | 2020-11-04 |
公开(公告)号: | CN114787919A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 亨克·海宁;菲利普·吉尔伯顿;艾瑞克·戈蒂埃 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G10L25/57 | 分类号: | G10L25/57;G10L25/51;G10L17/26;G08B13/16;G08B1/08;G08B29/18 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 张敏 |
地址: | 法国瑟松*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 至少 一个 人工 声源 环境 识别 真实 产生 一种 自然 发出 声音 方法 相应 装置 | ||
1.一种用于识别至少一种自然发出的声音的方法,所述声音由包括至少一个人工声源(ASSr)的环境中的真实声源产生,所述方法由音频识别设备实现,其中,所述方法包括:
-同时获得(11):
-来自位于所述环境中的第一麦克风(MIC)的第一音频信号;和
-来自与所述至少一个人工声源相关联的音频采集设备(AAD)的第二音频信号;
-分析(12)所述第一音频信号,并传递与在所述第一音频信号中识别的声音相对应的声音类别的第一列表(L1);
-分析(13)所述第二音频信号,并传递与在所述第二音频信号中识别的声音相对应的声音类别的第二列表(L2);
-传递(14)声音类别的第三列表(L3),所述声音类别的第三列表(L3)仅包括:被包括在所述声音类别的第一列表(L1)中、但不被包括在所述声音类别的第二列表(L2)中的声音类别。
2.根据权利要求1所述的方法,其中,所述方法还包括:当所述声音类别的第三列表(L3)不为空时,向通信终端发送(15)通知。
3.根据权利要求1所述的方法,其中,分析所述第一音频信号包括:计算一组参考声音类别上的第一概率分布,其中,所述一组参考声音类别中的每个参考声音类别与分数相关联,该分数表示在所述第一音频信号中存在属于该参考声音类别的声音的概率。
4.根据权利要求3所述的方法,其中,所述声音类别的第一列表包括关于所述第一概率分布具有大于或等于第一预定阈值的相关联分数的声音类别。
5.根据权利要求3所述的方法,其中,所述声音类别的第一列表包括第一预定数量n1个声音类别,其对应于关于所述第一概率分布具有最高分数的n1个声音类别。
6.根据权利要求1所述的方法,其中,分析所述第二音频信号包括:计算一组参考声音类别上的第二概率分布,其中,所述一组参考声音类别中的每个参考声音类别与分数相关联,该分数表示在所述第二音频信号中存在属于该参考声音类别的声音的概率。
7.根据权利要求6所述的方法,其中,所述声音类别的第二列表包括:关于所述第二概率分布具有大于或等于第二预定阈值的相关联分数的声音类别。
8.根据权利要求6所述的方法,其中,所述声音类别的第二列表包括第二预定数量n2个声音类别,其对应于关于所述第二概率分布具有最高分数的n2个声音类别。
9.根据权利要求1所述的方法,其中,所述音频采集设备(AAD)是位于所述人工声源(ASSr)附近的第二麦克风。
10.根据权利要求9所述的方法,其中,所述第二麦克风是指向所述人工声源的定向麦克风。
11.根据权利要求1所述的方法,其中,所述音频采集设备(AAD)以声学隔离的方式连接到所述人工声源(ASSr)的音频输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080082027.3/1.html,转载请声明来源钻瓜专利网。