[发明专利]音频信号处理方法、设备、系统及存储介质在审
申请号: | 202110235834.0 | 申请日: | 2021-03-03 |
公开(公告)号: | CN115019826A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 郑斯奇;索宏彬 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;张爱 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 设备 系统 存储 介质 | ||
本申请实施例提供一种音频信号处理方法、设备、系统及存储介质。在本申请实施例中,利用麦克风阵列采集音频信号,根据麦克风阵列中每个麦克风采集到音频信号的相位差信息,生成音频信号对应的声源空间分布信息,进而根据声源空间分布信息,结合基于历史音频信号学习到的单一语音与重叠语音之间的转换关系,识别当前音频信号是否为重叠语音,相比于单通道音频,利用麦克风阵列采集的音频信号,包含了声源空间分布信息,从而可以准确地识别当前音频信号是否为重叠语音,满足产品级别的检测需求。
技术领域
本申请涉及音频处理技术领域,尤其涉及一种音频信号处理方法、设备、系统及存储介质。
背景技术
麦克风阵列是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统。麦克风阵列对远场干扰噪声具有很强的抑制作用,可应用在一些具有语音采集功能的产品中,例如拾音器、录音笔等,以便准确采集各种场景中的语音信号。
在一些应用场景中,既存在单人发言的情况,也可能发生多个发言人同时发言的情况,所采集到的语音信号既可能包括单一语音信号,也可能包括多个发言人的发言重叠在一起的重叠语音信号。为了准确识别会议中同时有几个发言人,各自发言内容是什么,需要识别出重叠语音信号,进而对重叠语音信号做语音识别处理。
在现有技术中,可以通过大量音频数据训练得到的重叠语音检测模型,基于该检测模型对音频信号是否是重叠语音信号进行检测。但是,现有重叠语音检测大多是基于单通道音频的,直接将现有重叠语音检测技术应用到采用麦克风阵列的多通道音频场景中,其准确性会下降,无法满足产品级别的检测需求。
发明内容
本申请的多个方面提供一种音频信号处理方法、设备、系统及存储介质,用以提高识别语音是否为重叠语音的准确性,以满足产品级别的检测需求。
本申请实施例提供一种音频信号处理方法,包括:获取麦克风阵列采集到的当前音频信号,麦克风阵列包含至少两个麦克风;根据至少两个麦克风采集到当前音频信号的相位差信息,生成当前音频信号对应的当前声源空间分布信息;根据当前声源空间分布信息,结合基于历史音频信号学习到的单一语音与重叠语音之间的转换关系,识别当前音频信号是否为重叠语音。
本申请实施例还提供一种音频信号处理方法,适用于会议设备,会议设备包括麦克风阵列,该方法包括:获取麦克风阵列在会议场景中采集到的当前会议信号,麦克风阵列包含至少两个麦克风;根据至少两个麦克风采集到当前会议信号的相位差信息,生成当前会议信号对应的当前声源空间分布信息;根据当前声源空间分布信息,结合基于历史会议信号学习到的单一语音与重叠语音之间的转换关系,识别当前会议信号是否为重叠语音。
本申请实施例还提供一种音频信号处理方法,适用于教学设备,教学设备包括麦克风阵列,该方法包括:获取麦克风阵列在教学环境中采集到的当前课堂信号,麦克风阵列包含至少两个麦克风;根据至少两个麦克风采集到当前课堂信号的相位差信息,生成当前课堂信号对应的当前声源空间分布信息;根据当前声源空间分布信息,结合基于历史课堂信号学习到的单一语音与重叠语音之间的转换关系,识别当前课堂信号是否为重叠语音。
本申请实施例还提供一种音频信号处理方法,适用于智能车载设备,智能车载设备包括麦克风采集阵列,该方法包括:获取麦克风阵列在车载环境中采集到的当前音频信号,麦克风阵列包含至少两个麦克风;根据至少两个麦克风采集到当前音频信号的相位差信息,生成当前音频信号对应的当前声源空间分布信息;根据当前声源空间分布信息,结合基于历史音频信号学习到的单一语音与重叠语音之间的转换关系,识别当前音频信号是否为重叠语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110235834.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加长高围挡溢流蓄排水控制井及蓄排方法
- 下一篇:一种智能教学系统