[发明专利]一种语音识别结果的确定方法、装置、设备及存储介质在审

申请号：	202111422785.8	申请日：	2021-11-26
公开（公告）号：	CN114155843A	公开（公告）日：	2022-03-08
发明（设计）人：	戚婷;万根顺;胡国平;刘聪;高建清;王智国	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/08;G10L15/26;G06F16/35;G06F40/216;G06F40/232;G06F40/284
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	耿苑
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别结果确定方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种语音识别结果的确定方法、装置、设备及存储介质，其中，方法包括：在获得目标语音的若干候选识别结果后，将若干候选识别结果分别处理成文本单元序列，以得到若干文本单元序列；通过将若干文本单元序列对齐成等长序列，确定识别易错位置，并将任一对齐后的文本单元序列中的识别易错位置处的文本单元用指定符号替换，得到待预测文本单元序列；预测待预测文本单元序列中指定符号处的文本单元，并用预测出的文本单元替换指定符号，得到目标语音的最终识别结果。经由本申请提供的语音识别结果的确定方法能够确定出准确度较高的语音识别结果。

技术领域

本申请涉及语音识别技术领域，尤其涉及一种语音识别结果的确定方法、装置、设备及存储介质。

背景技术

语音识别技术是智能语音技术中最重要、最困难的核心技术之一，它的功能是把人的语音转换为对应的文本。

目前的语音识别过程通常包括两个阶段，第一个阶段是获取语音的若干候选识别结果，第二个阶段是根据第一阶段获得的若干候选识别结果确定语音的最终识别结果。

目前根据第一阶段获得的若干候选识别结果确定语音的最终识别结果的方式主要为：对第一阶段获得的每个候选识别结果进行重打分，将第一阶段获得的若干候选识别结果中得分最高的候选识别结果作为最终的识别结果。然而，经由上述方式确定的识别结果仍存在识别错误。

发明内容

有鉴于此，本申请提供了一种语音识别结果的确定方法、装置、设备及存储介质，用以解决现有的语音识别结果确定方法确定的识别结果存在识别错误的问题，其技术方案如下：

一种语音识别结果的确定方法，包括：

在获得目标语音的若干候选识别结果后，将所述若干候选识别结果分别处理成文本单元序列，得到若干文本单元序列；

通过将所述若干文本单元序列对齐成等长序列，确定识别易错位置，并将任一对齐后的文本单元序列中的识别易错位置处的文本单元用指定符号替换，得到待预测文本单元序列；

预测所述待预测文本单元序列中所述指定符号处的文本单元，并用预测出的文本单元替换所述指定符号，得到所述目标语音的最终识别结果。