[发明专利]基于相关性的近场检测器有效
申请号: | 201880041839.6 | 申请日: | 2018-05-09 |
公开(公告)号: | CN110770827B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 山缪尔·P·爱贝耐泽尔 | 申请(专利权)人: | 思睿逻辑国际半导体有限公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G01S3/80 |
代理公司: | 上海浦一知识产权代理有限公司 31211 | 代理人: | 张彦敏 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相关性 近场 检测器 | ||
根据本公开的实施例,一种用于检测音频设备中的近场源的方法可包括:计算第一麦克风信号和第二麦克风信号之间的归一化互相关函数,计算第一麦克风信号和第二麦克风信号中的每个的归一化自相关函数,将归一化互相关函数和归一化自相关函数划分为多个时滞区域,针对多个时滞区域中的每个相应时滞区域计算相应时滞区域内的归一化互相关函数和归一化自相关函数之间的相应最大偏差,组合来自多个时滞区域的相应最大偏差以导出多个检测统计量,并将多个检测统计量的每个检测统计量与相应阈值进行比较以检测近场信号。
技术领域
本公开的代表性实施例的领域涉及与音频设备中的语音应用有关或相关的方法、装置和实现方式。应用包括在话音活动检测器中检测近场事件。
背景技术
话音活动检测(VAD),也称为语音活动检测或语音检测,是一种在其中检测存在或不存在人类语音的在语音处理中使用的技术。VAD可用于多种应用,包括噪声抑制器、背景噪声估计器、自适应波束形成器、动态波束控制、常开话音检测和基于会话的回放管理。在可穿戴设备中使用的许多基于话音的信号处理算法中,近场语音检测是至关重要的元素。由于空间限制,可穿戴设备中的麦克风间距通常很小,并且常规的近场检测算法可能不适用于此类麦克风阵列。此外,由于可穿戴应用中的低功率约束,因此禁止使用计算上昂贵的算法诸如基于神经网络的分类方法。
在许多语音增强或降噪算法中,通常需要在存在干扰信号的情况下检测期望的语音信号,以实现所需的性能。干扰信号的范围从稳定的褐色噪声或道路噪声到动态信号诸如酒吧或饭店环境中存在的混串音/竞争性谈话者噪声。常规的话音活动检测器不能将期望的语音信号与类似语音的干扰信号区分开。在常规方法中,基于话音的信号处理算法通常依赖于使用麦克风阵列导出的空间统计信息,以在各种干扰噪声类型存在的情况下检测期望的语音信号。此类基于空间处理的传统检测器已成功用于麦克风间距大(35mm-150mm)的手机和耳机设备中。然而,当麦克风间距减小时,这些检测器的性能趋于劣化。由于空间限制,在较新的设备中,麦克风可紧密地布置在可穿戴设备中,并且由紧密间隔的麦克风阵列提供的空间多样化信息可随着间距的减小而劣化。
发明内容
根据本公开的教导,可以减少或消除与现有的近场检测方法相关联的一个或多个缺点和问题。
根据本公开的实施例,一种用于检测音频设备中的近场源的方法可包括:计算第一麦克风信号和第二麦克风信号之间的归一化互相关函数,计算第一麦克风信号和第二麦克风信号中的每个的归一化自相关函数,将归一化互相关函数和归一化自相关函数划分为多个时滞区域,针对多个时滞区域中的每个相应时滞区域计算相应时滞区域内的归一化互相关函数和归一化自相关函数之间的相应最大偏差,组合来自多个时滞区域的相应最大偏差以导出多个检测统计量,并将多个检测统计量的每个检测统计量与相应阈值进行比较以检测近场信号。
根据本公开的这些和其他实施例,用于实现音频设备的至少一部分的集成电路可包括:音频输出端,所述音频输出端被配置为通过生成音频输出信号以与音频设备的至少一个换能器通信再现音频信息,第一麦克风输入端,所述第一麦克风输入端被配置为接收第一麦克风信号,第二麦克风输入端,所述第二麦克风输入端被配置为接收第二麦克风信号,以及处理器,所述处理器被配置为实现近场检测器,所述检测器被配置为:计算第一麦克风信号和第二麦克风信号之间的归一化互相关函数,计算第一麦克风信号和第二麦克风信号中的每个的归一化自相关函数,将归一化互相关函数和归一化自相关函数划分为多个时滞区域,针对多个时滞区域中的每个相应时滞区域计算相应时滞区域内的归一化互相关函数和归一化自相关函数之间的相应最大偏差;组合来自多个时滞区域的相应最大偏差以导出多个检测统计量,并将多个检测统计量的每个检测统计量与相应阈值进行比较以检测近场信号。
根据本文所包括的附图、说明书和权利要求,本公开的技术优势对于本领域的普通技术人员而言将是显而易见的。实施例的目的和优点将至少通过权利要求中具体指出的要素、特征和组合来实现和达到。
应当理解,前面的一般描述和下面的详细描述都是示例和解释性的,并非限制本公开中提出的权利要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司,未经思睿逻辑国际半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880041839.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:安全的话语存储
- 下一篇:光盘和光盘的制造方法