[发明专利]一种语音识别方法、装置、设备及存储介质在审

申请号：	202210281930.3	申请日：	2022-03-22
公开（公告）号：	CN114520001A	公开（公告）日：	2022-05-20
发明（设计）人：	万根顺;王磊奇;潘嘉;高建清;刘聪;胡国平;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L15/197	分类号：	G10L15/197;G10L15/18;G10L15/26;G10L15/30;G10L15/06
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王云晓
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种语音识别方法、装置、设备及存储介质，其中，方法包括：获取待识别语音，基于预先训练得到的语音识别模型对待识别语音进行识别，其中，语音识别模型通过两个阶段的训练得到，第一阶段以使训练语音的识别结果与训练语音标注的文本一致为目标进行训练，第二阶段以平衡训练语音的语音识别结果的文本单元错误率与语义可接受度为目标进行训练。经由本发明提供的语音识别方法可获得用户可接受度较高的语音识别结果。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音识别方法、装置、设备及存储介质。

背景技术

语音识别技术为将语音识别为文本的技术。目前的语音识别方案为基于语音识别模型的方案，该方案基于预先训练得到的语音识别模型对待识别语音进行识别，以得到识别结果。

目前的语音识别方案中所使用过的语音识别模型通常基于交叉熵准则进行训练得到，然而，仅基于交叉熵准则进行训练得到的语音模型的识别性能不佳，进而导致基于训练得到的语音识别模型进行语音识别时，难以获得较好的识别效果。

发明内容

有鉴于此，本发明提供了一种语音识别方法、装置、设备及存储介质，用以解决目前的语音识别方案识别效果不佳的问题，其技术方案如下：

一种语音识别方法，包括：

获取待识别语音；

基于预先训练得到的语音识别模型对所述待识别语音进行识别；

其中，所述语音识别模型通过两个阶段的训练得到，第一阶段以使训练语音的识别结果与训练语音标注的文本一致为目标进行训练，第二阶段以平衡训练语音的语音识别结果的文本单元错误率与语义可接受度为目标进行训练。

可选的，第一阶段训练得到语音识别基线模型，第二阶段对所述语音识别基线模型进行训练；