[发明专利]语音信号的处理方法、组件、设备及介质有效
申请号: | 201710850441.4 | 申请日: | 2017-09-15 |
公开(公告)号: | CN109509465B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 都家宇;田彪;雷鸣;姚海涛;刘勇;黄雷 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 组件 设备 介质 | ||
本申请实施例公开了一种语音信号的处理方法、组件、设备及介质,用以提高语音控制的灵活性。所述方法,包括:处理组件将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号;所述处理组件对所述多路语音信号中的部分或全部进行并行识别,其中,所述并行识别包括:对所述多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种语音信号的处理方法、组件、设备及计算机可读存储介质。
背景技术
随着语音识别技术的不断发展,智能语音控制系统得到了快速的发展,智能语音控制系统通过对语音的识别,能够快速、准确、有效地执行相应的功能。
现有的智能语音控制系统,在采集到语音信号后,可以在智能语音控制系统的数据库中查找与语音信号语义相匹配的目标数据,进而根据查找到的目标数据所对应的控制指令,控制执行相应的功能。
但是,现有的语音控制系统只能响应于单个用户的语音信号执行相应的功能,缺乏灵活性。
发明内容
本申请实施例提供了一种语音信号的处理方法、组件、设备及计算机可读存储介质,用以提高语音控制的灵活性。
根据本申请实施例的第一方面,提供一种语音信号的处理方法,包括:
处理组件将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号;
处理组件对多路语音信号中的部分或全部进行并行识别,其中,并行识别包括:对多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧。
根据本申请实施例的第二方面,提供一种语音信号的处理组件,包括:
语音处理模块,用于将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号;
识别模块,用于对多路语音信号中的部分或全部进行并行识别,其中,并行识别包括:对多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧。
根据本申请实施例的第三方面,提供一种语音信号的处理设备,包括:存储器和处理器;该存储器用于储存有可执行程序代码;该处理器用于读取存储器中存储的可执行程序代码以执行上述语音信号的处理方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现上述语音信号的处理方法。
根据本申请实施例的第五方面,提供一种车载语音交互设备,设备包括:麦克风阵列和处理器;其中,
麦克风阵列,用于采集混合语音信号;
处理器,与麦克风阵列通信连接,用于将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号,并对多路语音信号中的部分或全部进行并行识别,其中,并行识别包括:对多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧。
根据本申请实施例的第六方面,提供一种车载互联网控制系统,包括:麦克风控制组件和控制组件;其中,
麦克风控制组件,用于控制麦克风阵列采集混合语音信号;
控制组件,用于控制将接收到的混合语音信号中来自不同方位的语音信号分离,得到多路语音信号,并对多路语音信号中的部分或全部进行并行识别,其中,并行识别包括:对多路语音信号中的部分或全部,分别将每路语音信号分成多个识别单位以进行识别,其中每个识别单位包括连续的多帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710850441.4/2.html,转载请声明来源钻瓜专利网。