[发明专利]一种语音识别方法、装置、电子设备及存储介质在审
申请号: | 202010265398.7 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111862967A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 蒋栋蔚 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 高玉光 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 电子设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述语音识别方法包括:
按照接收时序,将接收到的待识别语音切分为预设时长的多个语音序列;
确定每个语音序列对应的高维特征向量;
按照切分次序,依次将每个语音序列的高维特征向量输入至语音识别模型中,得到每个语音序列对应的文本序列;
基于得到的多个文本序列和每个文本序列对应的切分次序,确定待识别语音的文本信息。
2.根据权利要求1所述的语音识别方法,其特征在于,根据以下步骤确定每个语音序列对应的高维特征向量:
对每个语音序列按照预设长度进行分帧,以及对分帧后的该语音序列进行加窗处理,得到每个语音序列对应的语谱图信息;
从所述语谱图信息中逐帧提取语音特征,得到所述每个语音序列对应的语音特征向量;
对所述语音特征向量进行编码,得到每个语音序列对应的高维特征向量。
3.根据权利要求1所述的语音识别方法,其特征在于,针对每个语音序列,所述按照切分次序,依次将每个语音序列的高维特征向量输入至语音识别模型中,得到每个语音序列对应的文本序列,包括:
按照切分次序,依次将待处理的语音序列确定为当前语音序列,以及将当前语音序列对应的高维特征向量确定为当前语音向量;
获取与所述当前语音序列对应的初始状态向量;
将所述当前语音向量和所述初始状态向量输入至所述语音识别模型中,得到所述当前语音序列的文本序列。
4.根据权利要求3所述的语音识别方法,其特征在于,所述初始状态向量为在切分次序上,排在所述当前语音序列之前的前一个语音序列输入至所述语音识别模型后,输出的中间状态向量。
5.根据权利要求4所述的语音识别方法,其特征在于,当所述当前语音序列为在切分次序上的第一个语音序列时,所述初始状态向量为预设状态向量。
6.根据权利要求3所述的语音识别方法,其特征在于,所述将所述当前语音向量和所述初始状态向量输入至所述语音识别模型中,得到所述当前语音序列的文本序列,包括:
将所述当前语音向量和所述初始状态向量输入至所述语音识别模型的解码层中,得到与所述当前语音向量对应的中间文本向量、所述中间文本向量在所述当前语音向量中的目标位置和与所述目标位置对应的位置权重,以及中间状态向量;
基于得到的位置权重和所述当前语音向量,确定出用于解码处理的中间语音向量;
将确定出的中间语音向量作为所述当前语音向量,并将得到的中间状态向量作为所述初始状态向量,继续进行解码,直至预设次数后停止解码;
基于解码得到的多个中间文本向量和每个中间文本向量的位置权重,确定所述当前语音序列的文本序列。
7.根据权利要求6所述的语音识别方法,其特征在于,所述解码层包括解码器和分类器;所述将所述当前语音向量和所述初始状态向量输入至所述语音识别模型的解码层中,得到与所述当前语音向量对应的中间文本向量、所述中间文本向量在所述当前语音向量中的目标位置和与所述目标位置对应的位置权重,以及中间状态向量,包括:
将所述当前语音向量和所述初始状态向量输入至所述解码器中,得到与所述当前语音向量对应的中间文本向量、所述中间文本向量在所述当前语音向量中的不同位置和与每个位置对应的位置权重,以及中间状态向量;
将所述中间文本向量在所述当前语音向量中的不同位置和与每个位置对应的位置权重输入至所述分类器中,得到所述中间文本向量在所述当前语音向量中的目标位置和与所述目标位置对应的位置权重。
8.根据权利要求1所述的语音识别方法,其特征在于,所述基于得到的多个文本序列和每个文本序列对应的切分次序,确定待识别语音的文本信息,包括:
按照所述切分次序,将所述多个文本序列进行合并处理,得到所述待识别语音的文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010265398.7/1.html,转载请声明来源钻瓜专利网。