[发明专利]语音识别方法和装置、电子设备和存储介质在审
申请号: | 201910502583.0 | 申请日: | 2019-06-11 |
公开(公告)号: | CN112071310A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 王振兴;潘复平 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/32 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
本公开实施例公开了一种语音识别方法和装置、电子设备和存储介质,其中,语音识别方法包括:对待识别语音进行解码,得到所述待识别语音的第一解码路径;在对所述待识别语音进行解码的过程中,对至少一个所述第一解码路径进行解码;在对所述待识别语音解码完成后,对未进行解码的第一解码路径进行解码;根据所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果。本公开实施例减少了用户在输入最后一包数据时需要等待的时间,减少了整个语音识别过程需要的时间,改善了用户体验。
技术领域
本公开涉及语音识别技术,尤其是一种语音识别方法和装置、电子设备和存储介质。
背景技术
随着移动互联网的发展,语音识别越来越重要,它是很多其他应用能够实现的基础。例如,通过语音识别技术,可以实现语音拨号、语音导航等应用。语音识别结果越准确,以语音识别为基础的应用的效果就会越好。
在现有大词汇量的实时语音识别系统中,考虑到实时性需求,解码器在进行解码时,一般都使用较小的、效果较差的语言模型进行一遍解码,然后再使用较大的、效果较优的语言模型对一遍解码结果进行二遍解码,即对一遍解码结果生成的存放多个候选路径的候选解码网络(lattice)进行重新打分(rescore),以提高识别的正确率。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种语音识别方法和装置、电子设备和存储介质。
根据本公开实施例的一个方面,提供了一种语音识别方法,包括:
对待识别语音进行解码,得到所述待识别语音的第一解码路径;在对所述待识别语音进行解码的过程中,对至少一个所述第一解码路径进行解码;
在对所述待识别语音解码完成后,对未进行解码的第一解码路径进行解码;
根据所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果。
根据本公开实施例的另一个方面,提供了一种语音识别装置,包括:
第一解码模块,用于对待识别语音进行解码,得到所述待识别语音的第一解码路径;
第二解码模块,用于在对待识别语音进行解码的过程中,对所述第一解码模块得到的至少一个所述第一解码路径进行解码;以及在对所述待识别语音解码完成后,对未进行解码的第一解码路径进行解码;
确定模块,用于根据所述第二解码模块得到的所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果。
根据本公开实施例的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本公开上述任一实施例所述的语音识别方法。
根据本公开实施例的又一个方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910502583.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于区块链的品质管控系统及其控制方法
- 下一篇:一种解锁装置