[发明专利]语音识别方法、装置、存储介质及电子设备有效
申请号: | 202310819294.X | 申请日: | 2023-07-06 |
公开(公告)号: | CN116543771B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 李杰 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/02;G10L15/06;G10L15/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;石良武 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 存储 介质 电子设备 | ||
本申请属于语音技术领域,尤其涉及一种语音识别方法、装置、存储介质及电子设备,本申请通过获取待识别的语音信号;将所述语音信号输入到预先训练好的语音识别模型,获取所述语音识别模型对所述语音信号进行处理后全连接层的输出值;基于全连接层的输出值,利用sofmax计算公式以及设定的exp值确定方法计算所述语音信号的音素概率分布,利用所述语音信号的音素概率分布确定语音识别结果,如此,使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度。
技术领域
本申请涉及语音技术领域,特别涉及到一种语音识别方法、装置、存储介质及电子设备。
背景技术
在语音识别技术领域,一般采用端到端(e2e)的网络识别或者混合识别方式(声学模型(am)+语言模型)识别语音,e2e或者am全连接层的输出,一般是音素的概率分布。在这个过程中要经过一次softmax :softmax的计算公式为;其中exp表示以e为底的指数运算,,表示全连接层第i个节点的输出值,j表示全连接层节点的个数,即音素类别的个数。然而,低资源的设备是没有硬件的指数实现的,这导致低资源设备无法实时识别出语音。因此,如何使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度是亟需解决的技术问题。
发明内容
本申请的主要目的为提供一种语音识别方法、装置、存储介质及电子设备,旨在使语音实时识别在低端智能语音设备上变为现实且保证语音识别的精度。
第一方面,本申请实施例提供一种语音识别方法,包括:
获取待识别的语音信号;
将所述语音信号输入到预先训练好的语音识别模型,获取所述语音识别模型对所述语音信号进行处理后全连接层的输出值;其中,所述全连接层的输出值为定点值;
基于所述全连接层的输出值,利用公式计算所述语音信号的音素概率分布;其中,exp表示以e为底的指数运算,表示全连接层第i个节点的输出值,j表示全连接层节点的个数,即音素类别的个数;
利用所述语音信号的音素概率分布确定语音识别结果;
其中,在利用公式计算所述语音信号的音素概率分布的过程中,根据如下步骤确定所述全连接层的输出值对应的exp值:
判断所述全连接层的输出值是否小于设定的第一阈值;
若小于,则将所述全连接层的输出值对应的exp值置0;
否则,检测预先存储在存储器中的查找表中是否存在一索引值与所述全连接层的输出值的差值小于设定的第二阈值;其中,所述查找表包括索引值和索引值对应的exp值;
若存在,将所述索引值对应的exp值作为所述全连接层的输出值对应的exp值;
若不存在,将所述全连接层的输出值拆分为整数定点值和小数定点值;
利用所述查找表确定所述整数定点值对应的exp值;
按照s=s1+s2+..sn的规则,将所述小数定点值s拆分成n个更小的小数定点值;其中,s1至sn-1均为所述查找表中的索引值;
利用所述查找表确定s1至sn-1各自对应的exp值;
采用泰勒级数计算所述sn的exp值;
将所述整数定点值对应的exp值、所述s1至sn-1各自对应的exp值以及所述sn的exp值进行相乘,得到相乘结果,将所述相乘结果作为所述全连接层的输出值对应的exp值。
进一步的,所述查找表根据如下步骤构建得到:
计算[T1,-1]之间每个负整数的exp值,并将所述负整数的exp值转换为定点值,作为exp定点值;其中,T1为所述设定的第一阈值的浮点值,所述第一阈值的浮点值为负整数且小于负1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310819294.X/2.html,转载请声明来源钻瓜专利网。