[发明专利]语音识别方法、装置、存储介质及电子设备有效

申请号：	202310819294.X	申请日：	2023-07-06
公开（公告）号：	CN116543771B	公开（公告）日：	2023-10-13
发明（设计）人：	李杰	申请（专利权）人：	深圳市友杰智新科技有限公司
主分类号：	G10L15/28	分类号：	G10L15/28;G10L15/02;G10L15/06;G10L15/08
代理公司：	深圳市明日今典知识产权代理事务所(普通合伙) 44343	代理人：	王杰辉;石良武
地址：	518000 广东省深圳市南山***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请属于语音技术领域，尤其涉及一种语音识别方法、装置、存储介质及电子设备，本申请通过获取待识别的语音信号；将所述语音信号输入到预先训练好的语音识别模型，获取所述语音识别模型对所述语音信号进行处理后全连接层的输出值；基于全连接层的输出值，利用sofmax计算公式以及设定的exp值确定方法计算所述语音信号的音素概率分布，利用所述语音信号的音素概率分布确定语音识别结果，如此，使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度。

技术领域

本申请涉及语音技术领域，特别涉及到一种语音识别方法、装置、存储介质及电子设备。

背景技术

在语音识别技术领域，一般采用端到端（e2e）的网络识别或者混合识别方式(声学模型（am)+语言模型)识别语音，e2e或者am全连接层的输出，一般是音素的概率分布。在这个过程中要经过一次softmax ：softmax的计算公式为；其中exp表示以e为底的指数运算，，表示全连接层第i个节点的输出值，j表示全连接层节点的个数，即音素类别的个数。然而，低资源的设备是没有硬件的指数实现的，这导致低资源设备无法实时识别出语音。因此，如何使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度是亟需解决的技术问题。

发明内容

本申请的主要目的为提供一种语音识别方法、装置、存储介质及电子设备，旨在使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度。

第一方面，本申请实施例提供一种语音识别方法，包括：

获取待识别的语音信号；

将所述语音信号输入到预先训练好的语音识别模型，获取所述语音识别模型对所述语音信号进行处理后全连接层的输出值；其中，所述全连接层的输出值为定点值；

基于所述全连接层的输出值，利用公式计算所述语音信号的音素概率分布；其中，exp表示以e为底的指数运算，表示全连接层第i个节点的输出值，j表示全连接层节点的个数，即音素类别的个数；

利用所述语音信号的音素概率分布确定语音识别结果；

其中，在利用公式计算所述语音信号的音素概率分布的过程中，根据如下步骤确定所述全连接层的输出值对应的exp值：

判断所述全连接层的输出值是否小于设定的第一阈值；

若小于，则将所述全连接层的输出值对应的exp值置0；

否则，检测预先存储在存储器中的查找表中是否存在一索引值与所述全连接层的输出值的差值小于设定的第二阈值；其中，所述查找表包括索引值和索引值对应的exp值；

若存在，将所述索引值对应的exp值作为所述全连接层的输出值对应的exp值；