[发明专利]针对多设备系统中的改进的自动语音识别的可靠混响估计在审

申请号：	201811339302.6	申请日：	2018-11-12
公开（公告）号：	CN110010152A	公开（公告）日：	2019-07-12
发明（设计）人：	普泽斯拉·马泽斯基;亚当·库普瑞贾恩	申请（专利权）人：	英特尔公司
主分类号：	G10L25/03	分类号：	G10L25/03
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	林强
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	混响语音自动语音识别多设备系统计算逻辑应用逻辑麦克风多设备能量比检测捕获调制改进申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及针对多设备系统中的改进的自动语音识别的可靠混响估计。描述了根据一个实施例的用于辅助多设备混响估计的机构。如本文所述的，实施例的装置包括检测及捕获逻辑，用于辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令。该装置还包括计算逻辑，用于辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值，其中，计算逻辑还用于基于SRMR值来估计混响时间(RT)。该装置还包括决定及应用逻辑，用于基于对混响的所估计的RT来执行去混响。

技术领域

本文所描述的实施例总体涉及数据处理，更具体地，涉及辅助针对多设备系统中的改进的自动语音识别的可靠混响估计。

背景技术

用于混响时间测量的传统技术涉及全向扬声器和麦克风，其中扬声器和麦克风两者都需要分开合理的距离(例如，超过一米)。因此，这些传统技术不能在麦克风和扬声器彼此靠近的单个设备中实现。类似地，传统技术在如下多设备设置中实现时是不切实际的，在该多设备设置中，一个设备正在播放激励信号，而另一个设备正在测量响应(这些设备正在使用诸如音调或扫描之类的人工音频信号)。因此，传统技术是侵入性的。

发明内容

本申请的一方面提供了一种装置，该装置包括：检测及捕获逻辑，用于辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令；计算逻辑，用于辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值，其中，计算逻辑还用于基于SRMR值来估计混响时间(RT)；以及决定及应用逻辑，用于基于对混响的所估计的RT来执行去混响。

本申请的一方面提供了一种方法，该方法包括：辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令；辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值；基于SRMR值来估计混响时间(RT)；以及基于对混响的所估计的RT来执行去混响。

本申请的一方面提供了至少一种存储有多个指令的机器可读介质，多个指令当在计算设备上被执行时，使得计算设备实现或执行如本申请中所述的方法。

本申请的一方面提供了一种系统，包括实现或执行如本申请中所述的方法的机构。

本申请的一方面提供了一种设备，包括用于执行如本申请中所述的方法的装置。

本申请的一方面提供了一种计算设备，其被布置为实现或执行如本申请中所述的方法。

本申请的一方面提供了一种通信设备，其被布置为实现或执行如本申请中所述的方法。

附图说明

在附图中通过示例而非限制的方式示出了实施例，其中，相同的附图标记表示相似的元件。

图1示出了根据一个实施例的采用多设备混响估计机构的计算设备。

图2示出了根据一个实施例的图1的多设备混响估计机构。

图3A-图3B示出了根据一个实施例的用于可靠混响时间(RT)估计的多设备设置。

图3C-图3D示出了根据一个实施例的示出语音与混响调制能量比(SRMR)值的变化的图表。