[发明专利]语音识别模型生成方法及其设备、存储介质、电子设备有效

申请号：	201810024461.0	申请日：	2018-01-10
公开（公告）号：	CN108242234B	公开（公告）日：	2020-08-25
发明（设计）人：	孙涛	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/20
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别模型生成方法及其设备存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音识别模型生成方法，其特征在于，包括：

在样本语音数据集合中获取目标样本语音数据，针对所述目标样本语音数据在车载噪音数据集合中获取第一目标数量的车载点源噪音数据，以及在车载冲激响应数据集合中获取第二目标数量的车载冲激响应数据；

基于所述目标样本语音数据、所述第一目标数量的车载点源噪音数据以及所述第二目标数量的车载冲激响应数据，并采用混响信号模拟模型生成所述目标样本语音数据的车载混响语音集合；所述车载混响语音集合包括至少一个车载混响语音信号，所述混响信号模拟模型是用于对样本语音数据进行模拟而产生车载混响语音信号的模型，可采用计算公式：x_r(t)＝x(t)*h_s(t)+∑_in_i(t)*h_i(t)+d(t)进行计算，其中，x_r(t)表示车载空间输出的车载混响语音信号，x(t)表示输入的目标样本语音数据，n_i(t)表示所述车载空间包含的第i种点源噪声，h_s(t)表示所述车载空间中声源与麦克风相对位置下目标样本语音数据的冲激响应，h_i(t)表示所述车载空间中声源与麦克风相对位置下第i种点源噪音的冲激响应，d(t)表示背景噪音，*表示卷积计算，+表示信号的叠加，其中，所述i小于所述第一目标数量；

基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型。

2.根据权利要求1所述的方法，其特征在于，所述在样本语音数据集合中获取目标样本语音数据之前，还包括：

采集多种样本语音数据、多种车载点源噪音数据以及多种车载空间中各车载空间对应的车载冲激响应数据，并生成包含多种样本语音数据的样本语音数据集合、包含多种车载点源噪音数据的车载噪音数据集合以及包含各车载空间对应的车载冲激响应数据的车载冲激响应数据集合。

3.根据权利要求2所述的方法，其特征在于，所述采集多种车载空间中各车载空间对应的车载冲激响应数据，包括：

获取多种车载空间，并获取所述多种车载空间中各车载空间的声源与麦克风之间的各相对位置；

采用源镜像模型分别获取所述各相对位置下随响应时间变化的声压值；

将所述声压值作为所述各相对位置对应的车载冲激响应数据。

4.根据权利要求1所述的方法，其特征在于，所述基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合生成车载语音识别模型，包括：

创建语音识别模型，基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的第一语音识别参数；

将所述第一语音识别参数代入所述语音识别模型中，以生成车载语音识别模型。

5.根据权利要求4所述的方法，其特征在于，所述基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的第一语音识别参数，包括：

基于所述样本语音数据集合中各样本语音数据对应的车载混响语音集合获取所述语音识别模型的多组第二语音识别参数；