[发明专利]语音信号的处理方法、组件、设备及介质有效
申请号: | 201710850441.4 | 申请日: | 2017-09-15 |
公开(公告)号: | CN109509465B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 都家宇;田彪;雷鸣;姚海涛;刘勇;黄雷 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 组件 设备 介质 | ||
1.一种语音信号的处理方法,其特征在于,所述方法包括:
处理组件将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号;
所述处理组件对所述多路语音信号中的部分或全部进行并行识别,其中,所述并行识别包括:对所述多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧;其中,所述分别将每路语音信号分成多个识别单位以进行识别,包括:
分别对每路语音信号进行分帧处理,得到多帧语音数据;
在所述多帧语音数据中,从每预设数量帧语音数据中选取一帧作为目标帧语音数据;
以与所述目标帧语音数据相邻的多帧语音数据,以及所述目标帧语音数据为识别单位,对每路语音信号进行识别。
2.根据权利要求1所述的方法,其特征在于,所述处理组件将接收到的混合语音信号中来自不同方位的多路语音信号分离,包括:
确定所述混合语音信号中每路语音信号的方位信息;
基于每路语音信号的方位信息,将所述混合语音信号中来自不同方位的多路语音信号进行分离。
3.根据权利要求1所述的方法,其特征在于,所述处理组件将接收到的混合语音信号中来自不同方位的多路语音信号分离,得到多路语音信号之后,所述对所述多路语音信号中的部分或全部进行并行识别之前,所述方法还包括:
所述处理组件对每路语音信号进行波束成形处理和信号增强处理。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
并行检测每路语音信号的识别结果中是否包含唤醒词;
在检测到任一路语音信号的识别结果中包含唤醒词时,将包含所述唤醒词的识别结果发送至语音控制系统。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定包含所述唤醒词的识别结果对应语音信号的方位信息;
在预设时长内,定向采集所述方位信息的语音信号,并对采集到的语音信号进行波束成形处理和信号增强处理;
将波束成形处理和信号增强处理后的语音信号发送至所述语音控制系统。
6.根据权利要求5所述的方法,其特征在于,所述语音控制系统在被包含所述唤醒词的识别结果唤醒后,根据接收到的语音信号执行对应的功能。
7.根据权利要求1所述的方法,其特征在于,所述多路语音信号,包括:主驾驶的语音信号和副驾驶的语音信号。
8.一种语音信号的处理组件,其特征在于,所述处理组件包括:
语音处理模块,用于将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号;
识别模块,用于对所述多路语音信号中的部分或全部进行并行识别,其中,所述并行识别包括:对所述多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧;其中,所述识别模块,具体用于:
分别对每路语音信号进行分帧处理,得到多帧语音数据;
在所述多帧语音数据中,从每预设数量帧语音数据中选取一帧作为目标帧语音数据;
以与所述目标帧语音数据相邻的多帧语音数据,以及所述目标帧语音数据为识别单位,对每路语音信号进行识别。
9.根据权利要求8所述的组件,其特征在于,所述语音处理模块,具体用于:
确定所述混合语音信号中每路语音信号的方位信息;
基于每路语音信号的方位信息,将所述混合语音信号中来自不同方位的多路语音信号进行分离。
10.根据权利要求8所述的组件,其特征在于,所述处理组件还包括,信号增强模块,用于对每路语音信号进行波束成形处理和信号增强处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710850441.4/1.html,转载请声明来源钻瓜专利网。