[发明专利]语音识别模型生成方法及其设备、存储介质、电子设备有效
申请号: | 201810024461.0 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108242234B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 孙涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/20 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 生成 方法 及其 设备 存储 介质 电子设备 | ||
本发明实施例公开一种语音识别模型生成方法及其设备、存储介质、电子设备,其中方法包括如下步骤:在样本语音数据集合中获取目标样本语音数据,针对目标样本语音数据在车载噪音数据集合中获取第一目标数量的车载点源噪音数据,以及在车载冲激响应数据集合中获取第二目标数量的车载冲激响应数据;基于目标样本语音数据、第一目标数量的车载点源噪音数据以及第二目标数量的车载冲激响应数据,并采用混响信号模拟模型生成目标样本语音数据的车载混响语音集合;基于样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型。采用本发明,可以准确模拟车载混响语音信号,并可以提高采用语音识别模型识别车载语音信号的准确率。
技术领域
本发明涉及互联网技术领域,尤其涉及一种语音识别模型生成方法及其设备、存储介质、电子设备。
背景技术
语音是日常生活中携带信息的常用方式,随着语音技术的发展,也出现了越来越多的语音识别系统来进行语音识别,根据语音来源距离的不同,可以有远场语音和近场语音的分别,在进行语音识别时,针对不同的语音,可以采用不同的处理策略来进行语音处理,以便获取到清晰可识别的语音信息。
车载语音识别是发生在车载环境下的一种远场语音信号的识别。与近场语音识别相比,车载语音识别不得不考虑混响、噪音等更多的因素。
现有技术中,对于车载语音信号的识别过程,通常是采用模拟混响的数学模型对所采集的人声信号进行模拟,以生成车载混响语音信号,进而采用语音识别模型去识别该车载混响语音信号。而现有的模拟混响的数学模型虽然考虑了混响、点源噪音和背景噪音等参数,但通常采用定制化的车载空间,也就是说,车载空间尺寸、点源噪音以及背景噪音等参数都是固定值,从而使得所模拟的车载混响语音信号与真实车载环境中的语音信号差别大,进而导致采用现有的语音识别模型识别车载语音信号的准确率低。
发明内容
本发明实施例提供一种语音识别模型生成方法及其设备、存储介质、电子设备,可以准确模拟车载混响语音信号,使得所模拟的车载混响语音信号更接近真实车载环境中的语音信号,并基于模拟的车载混响语音信号生成车载语音识别模型,可以提高采用语音识别模型识别车载语音信号的准确率。
本发明实施例第一方面提供了一种语音识别模型生成方法,可包括:
在样本语音数据集合中获取目标样本语音数据,针对所述目标样本语音数据在车载噪音数据集合中获取第一目标数量的车载点源噪音数据,以及在车载冲激响应数据集合中获取第二目标数量的车载冲激响应数据;
基于所述目标样本语音数据、所述第一目标数量的车载点源噪音数据以及所述第二目标数量的车载冲激响应数据,并采用混响信号模拟模型生成所述目标样本语音数据的车载混响语音集合;
基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型。
可选的,所述在样本语音数据集合中获取当前样本语音数据之前,还包括:
采集多种样本语音数据、多种车载点源噪音数据以及多种车载空间中各车载空间对应的车载冲激响应数据,并生成包含多种样本语音数据的样本语音数据集合、包含多种车载点源噪音数据的车载噪音数据集合以及包含各车载空间对应的车载冲激响应数据的车载冲激响应数据集合。
可选的,所述采集多种车载空间中各车载空间对应的车载冲激响应数据,包括:
获取多种车载空间,并获取所述多种车载空间中各车载空间的声源与麦克风之间的各相对位置;
采用源镜像模型分别获取所述各相对位置下随响应时间变化的声压值;
将所述声压值作为所述各相对位置对应的车载冲激响应数据。
可选的,所述基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810024461.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音频数据的播放方法和装置
- 下一篇:电子设备及其语音识别方法