[发明专利]一种语音识别结果确定方法、装置、设备及存储介质在审

申请号：	202210094152.7	申请日：	2022-01-26
公开（公告）号：	CN114203169A	公开（公告）日：	2022-03-18
发明（设计）人：	桑宏报;方磊;杨军;何雪;方四安;柳林	申请（专利权）人：	合肥讯飞数码科技有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L25/72
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王云晓
地址：	230088 安徽省合肥市中国（安徽）自由贸易***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别结果确定方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种语音识别结果确定方法、装置、设备及存储介质，其中，方法包括：获取目标语音在多个语音识别系统上分别对应的候选集，其中，目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果；将获取的多个候选集两两组合，以得到若干组候选集；确定若干组候选集分别对应的相似性信息，并基于若干组候选集分别对应的相似性信息，从多个候选集中确定目标语音的识别结果，其中，相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。

技术领域

本申请涉及语音识别技术领域，尤其涉及一种语音识别结果确定方法、装置、设备及存储介质。

背景技术

语音识别是一种利用机器自动地将人类语音内容转换成文本的技术。近年来，随着深度神经网络的广泛应用，语音识别技术取得了长足的进步。

目前的确定语音识别结果的方案为：基于一个语音识别系统对目标语音进行识别，以得到若干候选识别结果，然后将若干候选识别结果中识别得分最高的候选识别结果，确定为目标语音的识别结果。

然而，受某些因素影响(比如复杂的口音、方言、远讲、噪声、混响环境、语义理解等)，语音识别系统的识别性能不稳定，这导致上述方案稳定性不足，有时无法获得准确度较高的识别结果。

发明内容

有鉴于此，本申请提供了一种语音识别结果确定方法、装置、设备及存储介质，用以解决现有的语音识别结果确定方法稳定性不足，有时无法获得准确度较高的识别结果的问题，其技术方案如下：

一种语音识别结果确定方法，包括：

获取目标语音在多个语音识别系统上分别对应的候选集，其中，所述目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果；

将获取的多个候选集两两组合，以得到若干组候选集；

确定若干组候选集分别对应的相似性信息，并基于所述若干组候选集分别对应的相似性信息，从所述多个候选集中确定目标语音的识别结果，其中，所述相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。