[发明专利]语音识别模型生成方法及其设备、存储介质、电子设备有效
申请号: | 201810024461.0 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108242234B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 孙涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/20 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 生成 方法 及其 设备 存储 介质 电子设备 | ||
1.一种语音识别模型生成方法,其特征在于,包括:
在样本语音数据集合中获取目标样本语音数据,针对所述目标样本语音数据在车载噪音数据集合中获取第一目标数量的车载点源噪音数据,以及在车载冲激响应数据集合中获取第二目标数量的车载冲激响应数据;
基于所述目标样本语音数据、所述第一目标数量的车载点源噪音数据以及所述第二目标数量的车载冲激响应数据,并采用混响信号模拟模型生成所述目标样本语音数据的车载混响语音集合;所述车载混响语音集合包括至少一个车载混响语音信号,所述混响信号模拟模型是用于对样本语音数据进行模拟而产生车载混响语音信号的模型,可采用计算公式:xr(t)=x(t)*hs(t)+∑ini(t)*hi(t)+d(t)进行计算,其中,xr(t)表示车载空间输出的车载混响语音信号,x(t)表示输入的目标样本语音数据,ni(t)表示所述车载空间包含的第i种点源噪声,hs(t)表示所述车载空间中声源与麦克风相对位置下目标样本语音数据的冲激响应,hi(t)表示所述车载空间中声源与麦克风相对位置下第i种点源噪音的冲激响应,d(t)表示背景噪音,*表示卷积计算,+表示信号的叠加,其中,所述i小于所述第一目标数量;
基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型。
2.根据权利要求1所述的方法,其特征在于,所述在样本语音数据集合中获取目标样本语音数据之前,还包括:
采集多种样本语音数据、多种车载点源噪音数据以及多种车载空间中各车载空间对应的车载冲激响应数据,并生成包含多种样本语音数据的样本语音数据集合、包含多种车载点源噪音数据的车载噪音数据集合以及包含各车载空间对应的车载冲激响应数据的车载冲激响应数据集合。
3.根据权利要求2所述的方法,其特征在于,所述采集多种车载空间中各车载空间对应的车载冲激响应数据,包括:
获取多种车载空间,并获取所述多种车载空间中各车载空间的声源与麦克风之间的各相对位置;
采用源镜像模型分别获取所述各相对位置下随响应时间变化的声压值;
将所述声压值作为所述各相对位置对应的车载冲激响应数据。
4.根据权利要求1所述的方法,其特征在于,所述基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型,包括:
创建语音识别模型,基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的第一语音识别参数;
将所述第一语音识别参数代入所述语音识别模型中,以生成车载语音识别模型。
5.根据权利要求4所述的方法,其特征在于,所述基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的第一语音识别参数,包括:
基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的多组第二语音识别参数;
将所述多组第二语音识别参数分别代入所述语音识别模型中,以生成测试语音识别模型集合;
分别获取所述测试语音识别模型集合中各测试语音识别模型对应的识别错误率;
基于所述识别错误率在所述各样本语音数据对应的车载混响语音集合中选取样本车载混响语音信号作为训练样本;
基于所述训练样本获取所述语音识别模型的第一语音识别参数。
6.根据权利要求5所述的方法,其特征在于,所述分别获取所述测试语音识别模型集合中各测试语音识别模型对应的识别错误率,包括:
采集车载语音数据,采用所述测试语音识别模型集合中各测试语音识别模型分别对所述车载语音数据进行识别,以分别获取所述各测试语音识别模型对应的识别错误率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810024461.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频数据的播放方法和装置
- 下一篇:电子设备及其语音识别方法