[发明专利]语音识别及模型建立方法、装置、设备和存储介质有效
申请号: | 202111122263.6 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113889087B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 梁鸣心;付晓寅;贾磊;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183;G10L15/22;G10L15/26;G10L15/30 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 建立 方法 装置 设备 存储 介质 | ||
1.一种语音识别方法,包括:
对语音信号进行流式处理,以获得所述流式处理的输出结果,所述输出结果包括:所述语音信号的初始序列单元对应的上下文特征;
对所述上下文特征进行非自回归处理,以获得最终序列单元;
基于所述最终序列单元,获得语音识别结果;
其中,所述上下文特征包括至少一个时刻的上下文特征,所述输出结果还包括:至少一个时刻的初始序列单元,所述至少一个时刻的上下文特征包括:上一时刻的上下文特征和当前时刻的上下文特征、所述至少一个时刻的初始序列单元包括:上一时刻的初始序列单元和当前时刻的初始序列单元;
所述对语音信号进行流式处理,以获得所述流式处理的输出结果,包括:
对所述上一时刻的初始序列单元和所述上一时刻的上下文特征进行拼接处理,以获得拼接向量;
对所述拼接向量进行映射处理,以获得映射向量;
对所述语音信号对应的编码向量和所述映射向量进行注意力处理,以获得所述当前时刻的上下文特征;
对所述当前时刻的上下文特征进行分类处理,以获得所述当前时刻的初始序列单元。
2.根据权利要求1所述的方法,其中,所述对语音信号进行流式处理,以获得所述流式处理的输出结果,还包括:
将所述语音信号分帧为至少一帧的语音帧;
对所述语音帧进行编码处理,以获得所述编码向量。
3.根据权利要求1所述的方法,其中,所述对所述上下文特征进行非自回归处理,包括:
采用非时序依赖的深度学习模型,对所述上下文特征进行非自回归处理。
4.根据权利要求1所述的方法,其中,所述初始序列单元的长度为第一长度,所述最终序列单元的长度为第二长度,所述第一长度与所述第二长度不同,所述上下文特征的长度为所述第一长度,所述非自回归处理采用深度学习模型进行处理,所述对所述上下文特征进行非自回归处理,包括:
采用所述深度学习模型的第一部分,对所述第一长度的上下文特征进行非自回归处理,以获得第一长度的输出向量;
采用所述深度学习模型的长度转换层,对所述第一长度的输出向量进行长度转换处理,以获得第二长度的输出向量;
采用所述深度学习模型的第二部分,对所述第二长度的输出向量进行非自回归处理,以获得所述第二长度的最终序列单元。
5.根据权利要求4所述的方法,其中,所述第一长度大于所述第二长度,所述长度转换层包括:池化层,或者,拼接层。
6.根据权利要求1-5任一项所述的方法,其中,所述基于所述最终序列单元,获得语音识别结果,包括:
若所述最终序列单元为发音单元,基于所述发音单元和语言模型,获得语音识别结果;或者,
若所述最终序列单元为文本单元,将所述文本单元作为语音识别结果。
7.一种语音识别模型的建立方法,包括:
对语音信号样本进行流式处理,以获得所述流式处理的输出结果,所述输出结果包括:所述语音信号样本的初始建模单元对应的上下文特征;
对所述上下文特征进行非自回归处理,以获得最终建模单元;
基于所述最终建模单元,建立语音识别模型;
其中,所述上下文特征包括至少一个时刻的上下文特征,所述输出结果还包括:至少一个时刻的初始建模单元,所述至少一个时刻的上下文特征包括:上一时刻的上下文特征和当前时刻的上下文特征、所述至少一个时刻的初始建模单元包括:上一时刻的初始建模单元和当前时刻的初始建模单元;
所述对语音信号样本进行流式处理,以获得所述流式处理的输出结果,包括:
对所述上一时刻的初始建模单元和所述上一时刻的上下文特征进行拼接处理,以获得拼接向量;
对所述拼接向量进行映射处理,以获得映射向量;
对所述语音信号样本对应的编码向量和所述映射向量进行注意力处理,以获得所述当前时刻的上下文特征;
对所述当前时刻的上下文特征进行分类处理,以获得所述当前时刻的初始建模单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111122263.6/1.html,转载请声明来源钻瓜专利网。