[发明专利]语音识别方法、装置、电子设备及存储介质有效

申请号：	202110659669.1	申请日：	2021-06-15
公开（公告）号：	CN113257239B	公开（公告）日：	2021-10-08
发明（设计）人：	陈诚;黄石磊;程刚	申请（专利权）人：	深圳市北科瑞声科技股份有限公司
主分类号：	G10L15/16	分类号：	G10L15/16;G10L19/16
代理公司：	深圳智汇远见知识产权代理有限公司 44481	代理人：	刘洁;牛悦涵
地址：	518036 广东省深圳市福田区梅林街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及人工智能技术领域，揭露了一种语音识别方法，所述方法包括：获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。此外，本申请还涉及一种语音识别装置、电子设备及存储介质。本申请可以提高语音识别的速度。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种语音识别方法、装置、电子设备及存储介质。

背景技术

随着互联网的普及，在客户端和服务器端产生的数据越来越多，这些数据包括文本类型的数据和非文本类型的数据，如语音数据。实际应用中常需要对这些非文本类型的数据进行识别，例如，语音识别。通过语音识别可以将语音中的信息转换为文本信息，进而进行自然语言处理或者是人机交互等操作。当需要识别的语音数据比较多时，若无法快速获取到语音识别结果，将影响语音识别的后续操作，如影响自然语音处理的结果（如无法快速识别用户意图）或者影响人机交互的效率（如无法快速根据用户发出的语音信息执行相应控制操作）。因此，亟需一种提高语音识别的速度的技术方案。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种语音识别方法、装置、电子设备及存储介质。

第一方面，本申请提供了一种语音识别方法，所述方法包括：

获取待处理语音数据流，所述待处理语音数据流包含多个语音单元数据；

通过集成神经网络依次将多个所述语音单元数据进行编码，并在得到任意一所述语音单元数据的编码数据之后，实时将所述编码数据输入至与所述集成神经网络分开部署的解码器进行解码，以得到多个所述语音单元数据的语音识别结果。

可选地，所述通过集成神经网络依次将多个所述语音单元数据进行编码，包括：

提取多个所述语音单元数据的语音标识信息和位置信息；

将所述语音标识信息和所述位置信息进行组合，得到多个所述语音单元数据的语音单元特征；

通过集成神经网络依次将多个所述语音单元特征进行编码。

可选地，所述通过集成神经网络依次将多个所述语音单元特征进行编码，包括：

将第i个所述语音单元特征输入至所述集成神经网络进行编码，其中i的初始值为1，i为正整数；

当得到所述集成神经网络输出的第i个所述语音单元特征的编码数据时，令i=i+1，再次执行所述将第i个所述语音单元特征输入至所述集成神经网络进行编码的操作。