[发明专利]语音识别方法、装置、设备以及计算机可读存储介质有效
申请号: | 201710994268.5 | 申请日: | 2017-10-23 |
公开(公告)号: | CN107680597B | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 梁浩;程宁;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种语音识别方法、装置、设备以及计算机可读存储介质,其中所述方法包括根据预设规则对待测语音信息进行分帧和声学特征提取以得到帧级语音特征序列;将所述帧级语音特征序列依次分为n个信息块;将所有信息块并行输入预设的双向长短时递归神经网络模型中;获取每个信息块对应的前向识别结果以及后向识别结果在所述预设的双向长短时递归神经网络模型的输出层的相应的神经元结点下的输出结果,以得到所述待测语音信息的语音识别结果。本发明可以极大地提高语音识别的效果,有效缩短了语音解码的时延。 | ||
搜索关键词: | 语音识别 信息块 计算机可读存储介质 递归神经网络 语音特征序列 语音信息 预设 帧级 神经元 语音识别结果 输出结果 特征提取 语音解码 预设规则 和声学 输出层 分帧 后向 结点 前向 时延 并行 | ||
【主权项】:
1.一种语音识别方法,其特征在于,所述方法包括:根据预设规则对待测语音信息进行分帧和声学特征提取以得到帧级语音特征序列;将所述帧级语音特征序列依次分为n个信息块,其中n为大于等于2的整数,每个信息块包括一主信息块,每一主信息块拼接有一从信息块,每个主信息块以及与其相应的从信息块均包括若干帧语音特征信息,所述主信息块的最后一帧语音特征信息与拼接的所述从信息块的第一帧语音特征信息相邻;将所有信息块并行输入预设的双向长短时递归神经网络模型中,以分别计算每个信息块中的主信息块在所述预设的双向长短时递归神经网络模型的隐含层的相应的神经元结点下的前向识别结果,以及每个信息块在所述预设的双向长短时递归神经网络模型的隐含层的相应的神经元结点下的后向识别结果;获取每个信息块对应的前向识别结果以及后向识别结果在所述预设的双向长短时递归神经网络模型的输出层的相应的神经元结点下的输出结果,以得到所述待测语音信息的语音识别结果;其中,所述预设的双向长短时递归神经网络模型包括由所有信息块对应的神经元结点组成的输入层、由非线性映射单元组成的隐藏层以及与隐藏层输出结果相应的神经元结点组成的输出层;在所述预设的双向长短时递归神经网络模型的前后向计算中均采用块处理的方式读取帧级语音特征序列,即根据按帧长固定将读入帧级语音特征序列无重叠的等间隔的切分为多个主信息块,在反向计算中则拼接固定帧长的语音特征信息到每个主信息块的后面,此处拼接固定帧长的语音特征信息即组成相应的从信息块,每个主信息块以及相应的从信息块构成一信息块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710994268.5/,转载请声明来源钻瓜专利网。
- 上一篇:像素电路、其驱动方法及有机发光显示面板、显示装置
- 下一篇:一种电力变压器