[发明专利]一种语音识别结果确定方法、装置、设备及存储介质在审
申请号: | 202210094152.7 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114203169A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 桑宏报;方磊;杨军;何雪;方四安;柳林 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L25/72 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 230088 安徽省合肥市中国(安徽)自由贸易*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 结果 确定 方法 装置 设备 存储 介质 | ||
本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别结果确定方法、装置、设备及存储介质。
背景技术
语音识别是一种利用机器自动地将人类语音内容转换成文本的技术。近年来,随着深度神经网络的广泛应用,语音识别技术取得了长足的进步。
目前的确定语音识别结果的方案为:基于一个语音识别系统对目标语音进行识别,以得到若干候选识别结果,然后将若干候选识别结果中识别得分最高的候选识别结果,确定为目标语音的识别结果。
然而,受某些因素影响(比如复杂的口音、方言、远讲、噪声、混响环境、语义理解等),语音识别系统的识别性能不稳定,这导致上述方案稳定性不足,有时无法获得准确度较高的识别结果。
发明内容
有鉴于此,本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,用以解决现有的语音识别结果确定方法稳定性不足,有时无法获得准确度较高的识别结果的问题,其技术方案如下:
一种语音识别结果确定方法,包括:
获取目标语音在多个语音识别系统上分别对应的候选集,其中,所述目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;
将获取的多个候选集两两组合,以得到若干组候选集;
确定若干组候选集分别对应的相似性信息,并基于所述若干组候选集分别对应的相似性信息,从所述多个候选集中确定目标语音的识别结果,其中,所述相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。
可选的,获取目标语音在一个语音识别系统上对应的候选集,包括:
获取该语音识别系统对目标语音进行识别后输出的多个候选识别结果;
确定所述多个候选识别结果中是否存在解码异常的候选识别结果;
若是,则将解码异常的候选识别结果剔除,由剩余的候选识别结果组成所述目标语音在该语音识别系统上对应的候选集;
若否,则由所述多个候选识别结果组成所述目标语音在该语音识别系统上对应的候选集。
可选的,所述确定所述多个候选识别结果中是否存在解码异常的候选识别结果,包括:
确定所述多个候选识别结果中是否存在每秒解码词数大于预设词数阈值的候选识别结果;
若是,则确定所述多个候选识别结果中存在解码异常的候选识别结果;
若否,则确定所述多个候选识别结果中不存在解码异常的候选识别结果;
所述将解码异常的候选识别结果剔除,包括:
将每秒解码词数大于所述预设词数阈值的候选识别结果剔除。
可选的,所述基于所述若干组候选集分别对应的相似性信息,从所述多个候选集中确定目标语音的识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210094152.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种洗碗装置
- 下一篇:一种信息隐藏方法、装置、设备和介质