[发明专利]针对多设备系统中的改进的自动语音识别的可靠混响估计在审
申请号: | 201811339302.6 | 申请日: | 2018-11-12 |
公开(公告)号: | CN110010152A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 普泽斯拉·马泽斯基;亚当·库普瑞贾恩 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 林强 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 语音 自动语音识别 多设备系统 计算逻辑 应用逻辑 麦克风 多设备 能量比 检测 捕获 调制 改进 申请 | ||
本申请涉及针对多设备系统中的改进的自动语音识别的可靠混响估计。描述了根据一个实施例的用于辅助多设备混响估计的机构。如本文所述的,实施例的装置包括检测及捕获逻辑,用于辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令。该装置还包括计算逻辑,用于辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值,其中,计算逻辑还用于基于SRMR值来估计混响时间(RT)。该装置还包括决定及应用逻辑,用于基于对混响的所估计的RT来执行去混响。
技术领域
本文所描述的实施例总体涉及数据处理,更具体地,涉及辅助针对多设备系统中的改进的自动语音识别的可靠混响估计。
背景技术
用于混响时间测量的传统技术涉及全向扬声器和麦克风,其中扬声器和麦克风两者都需要分开合理的距离(例如,超过一米)。因此,这些传统技术不能在麦克风和扬声器彼此靠近的单个设备中实现。类似地,传统技术在如下多设备设置中实现时是不切实际的,在该多设备设置中,一个设备正在播放激励信号,而另一个设备正在测量响应(这些设备正在使用诸如音调或扫描之类的人工音频信号)。因此,传统技术是侵入性的。
发明内容
本申请的一方面提供了一种装置,该装置包括:检测及捕获逻辑,用于辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令;计算逻辑,用于辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值,其中,计算逻辑还用于基于SRMR值来估计混响时间(RT);以及决定及应用逻辑,用于基于对混响的所估计的RT来执行去混响。
本申请的一方面提供了一种方法,该方法包括:辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令;辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值;基于SRMR值来估计混响时间(RT);以及基于对混响的所估计的RT来执行去混响。
本申请的一方面提供了至少一种存储有多个指令的机器可读介质,多个指令当在计算设备上被执行时,使得计算设备实现或执行如本申请中所述的方法。
本申请的一方面提供了一种系统,包括实现或执行如本申请中所述的方法的机构。
本申请的一方面提供了一种设备,包括用于执行如本申请中所述的方法的装置。
本申请的一方面提供了一种计算设备,其被布置为实现或执行如本申请中所述的方法。
本申请的一方面提供了一种通信设备,其被布置为实现或执行如本申请中所述的方法。
附图说明
在附图中通过示例而非限制的方式示出了实施例,其中,相同的附图标记表示相似的元件。
图1示出了根据一个实施例的采用多设备混响估计机构的计算设备。
图2示出了根据一个实施例的图1的多设备混响估计机构。
图3A-图3B示出了根据一个实施例的用于可靠混响时间(RT)估计的多设备设置。
图3C-图3D示出了根据一个实施例的示出语音与混响调制能量比(SRMR)值的变化的图表。
图3E示出了根据一个实施例的示出SRMR值与RT之间的关系的图表。
图4A示出了根据一个实施例的用于多设备设置中的改进的自动语音识别(ASR)的可靠混响估计的事务序列。
图4B示出了根据一个实施例的用于多设备设置中针对改进的ASR进行可靠混响估计的方法。
图5示出了根据一个实施例的能够支持和实现一个或多个实施例的计算机设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811339302.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信号处理方法及设备、存储介质
- 下一篇:一种音量均衡方法及装置