[发明专利]音频信号处理方法、设备、系统及存储介质在审
申请号: | 202110235834.0 | 申请日: | 2021-03-03 |
公开(公告)号: | CN115019826A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 郑斯奇;索宏彬 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;张爱 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 设备 系统 存储 介质 | ||
1.一种音频信号处理方法,其特征在于,包括:
获取麦克风阵列采集到的当前音频信号,所述麦克风阵列包含至少两个麦克风;
根据所述至少两个麦克风采集到当前音频信号的相位差信息,生成当前音频信号对应的当前声源空间分布信息;
根据所述当前声源空间分布信息,结合基于历史音频信号学习到的单一语音与重叠语音之间的转换关系,识别当前音频信号是否为重叠语音。
2.根据权利要求1所述的方法,其特征在于,根据所述至少两个麦克风采集到当前音频信号的相位差信息,生成当前音频信号对应的当前声源空间分布信息,包括:
根据所述至少两个麦克风采集到当前音频信号的相位差信息,计算当前音频信号对应的波达谱图,所述波达谱图反应当前声源在空间上的分布情况。
3.根据权利要求2所述的方法,其特征在于,根据所述至少两个麦克风采集到当前音频信号的相位差信息,计算当前音频信号对应的波达谱图,包括:
针对位置空间中的任一方位,对任意两个麦克风采集到当前音频信号的相位差信息进行累加,得到所述方位作为当前声源位置的概率;
根据所述位置空间中各方位作为当前声源位置的概率,生成当前音频信号对应的波达谱图。
4.根据权利要求1-3任一项所述的方法,其特征在于,根据所述当前声源空间分布信息,结合基于历史音频信号学习到的单一语音与重叠语音之间的转换关系,识别当前音频信号是否为重叠语音,包括:
计算所述当前声源空间分布信息的峰值信息,作为隐马尔科夫模型HMM的当前观测状态,并将单一语音与重叠语音作为HMM的两个隐藏状态;
将当前观测状态输入HMM,结合HMM学习到的两个隐藏状态之间的跳转关系,以历史观测状态为前提条件,计算当前观测状态对应隐藏状态的概率;
根据所述当前观测状态对应隐藏状态的概率,识别当前音频信号是否为重叠语音。
5.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
若识别到当前音频信号为重叠语音,则根据所述当前声源空间分布信息,确定至少两个有效声源方位;
对所述至少两个有效声源方位上的音频信号进行语音增强,并对所述至少两个有效声源方位上增强后的音频信号分别进行语音识别。
6.根据权利要求5所述的方法,其特征在于,根据所述当前声源空间分布信息,确定至少两个有效声源方位,包括:
在所述当前声源空间分布信息包括各方位作为当前声源位置的概率的情况下,将作为当前声源位置的概率最大的两个方位作为有效声源方位。
7.根据权利要求6所述的方法,其特征在于,还包括:
若识别到当前音频信号为单一语音,则将作为当前声源位置的概率最大的一个方位作为有效声源方位;
对所述有效声源方位上的音频信号进行语音增强,并对所述有效声源方位上增强后的音频信号进行语音识别。
8.根据权利要求1-3任一项所述的方法,其特征在于,在识别当前音频信号是否为重叠语音之前,还包括:
根据所述当前的声源空间分布信息,计算当前音频信号的波达方向;
根据所述波达方向,从所述至少两个麦克风中选择一路麦克风作为目标麦克风;
对所述目标麦克风采集到的当前音频信号进行语音端点检测VAD,以得到当前音频信号是否为语音信号。
9.一种音频信号处理方法,其特征在于,适用于会议设备,所述会议设备包括麦克风阵列,所述方法包括:
获取所述麦克风阵列在会议场景中采集到的当前会议信号,所述麦克风阵列包含至少两个麦克风;
根据所述至少两个麦克风采集到当前会议信号的相位差信息,生成当前会议信号对应的当前声源空间分布信息;
根据所述当前声源空间分布信息,结合基于历史会议信号学习到的单一语音与重叠语音之间的转换关系,识别当前会议信号是否为重叠语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110235834.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加长高围挡溢流蓄排水控制井及蓄排方法
- 下一篇:一种智能教学系统