[发明专利]语音识别方法和装置、电子设备和存储介质在审
申请号: | 201910502583.0 | 申请日: | 2019-06-11 |
公开(公告)号: | CN112071310A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 王振兴;潘复平 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/32 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
1.一种语音识别方法,包括:
对待识别语音进行解码,得到所述待识别语音的第一解码路径;
在对所述待识别语音进行解码的过程中,对至少一个所述第一解码路径进行解码;
在对所述待识别语音解码完成后,对未进行解码的第一解码路径进行解码;
根据所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果。
2.根据权利要求1所述的方法,其中,所述对待识别语音进行解码,包括:利用第一语言模型对所述待识别语音进行解码;
对第一解码路径进行解码,包括:利用第二语言模型对第一解码路径进行解码。
3.根据权利要求2所述的方法,其中,所述利用所述第一语言模型对所述待识别语音进行解码之前,还包括:
依次从所述待识别语音中读取一个语音帧,对读取的语音帧进行声学特征提取,得所述读取的语音帧的语音特征信息;
利用声学模型,对所述语音特征信息进行识别,得到所述读取的语音帧的声学识别结果,所述声学识别结果包括:至少一个词以及所述至少一个词中各词的声学得分。
4.根据权利要求3所述的方法,其中,所述利用第一语言模型对所述待识别语音进行解码,包括:利用所述第一语言模型,分别对所述读取的语音帧的声学识别结果中各词进行打分,得到所述读取的语音帧的声学识别结果中各词的第一语言得分;其中,所述第一解码路径基于所述读取的语音帧的声学识别结果与历史语音帧的声学识别结果得到,所述历史语音帧包括:所述待识别语音中时序位于所述读取的语音帧之前的语音帧;或者,
利用第二语言模型对第一解码路径进行解码,包括:利用所述第二语言模型,依次对所述第一解码路径中各语音帧的声学识别结果中的各词重新进行打分,得到各语音帧的声学识别结果中各词的第二语言得分,保存所述第二语言得分、以及对所述第一解码路径解码得到的第二解码路径。
5.根据权利要求4所述的方法,其中,所述得到所述读取的语音帧的声学识别结果中各词的第一语言得分之后,还包括:
对经过所述读取的语音帧的声学识别结果中各词的第一解码路径进行排序并去重。
6.根据权利要求1-5任一所述的方法,其中,所述对未进行解码的第一解码路径进行解码,包括:
基于所述第一解码路径生成解码网络;
对所述解码网络中未完成解码的第一解码路径进行二遍解码,得到所述解码网络对应的第二解码路径。
7.根据权利要求6所述的方法,其中,所述根据所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果,包括:
根据所述待识别语音中各语音帧的声学识别结果中各词的第二语言得分,确定各第二解码路径的综合得分;
从所述解码网络对应的第二解码路径中选择综合得分最高的第二解码路径作为待识别语音的语音识别结果。
8.一种语音识别装置,包括:
第一解码模块,用于对待识别语音进行解码,得到所述待识别语音的第一解码路径;
第二解码模块,用于在对待识别语音进行解码的过程中,对所述第一解码模块得到的至少一个所述第一解码路径进行解码;以及在对所述待识别语音解码完成后,对未进行解码的第一解码路径进行解码;
确定模块,用于根据所述第二解码模块得到的所述第一解码路径的解码结果,确定所述待识别语音的语音识别结果。
9.根据权利要求8所述的装置,其中,第一解码模块,用于利用第一语言模型对所述待识别语音进行解码;
所述第二解码模块,用于利用第二语言模型对所述第一解码模块得到的所述第一解码路径进行解码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910502583.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于区块链的品质管控系统及其控制方法
- 下一篇:一种解锁装置