[发明专利]语音处理方法、装置、设备及存储介质在审

申请号：	202211421770.4	申请日：	2022-11-14
公开（公告）号：	CN115762500A	公开（公告）日：	2023-03-07
发明（设计）人：	祁鹏;许丽;万根顺;潘嘉;刘聪;胡国平;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L15/20	分类号：	G10L15/20;G10L25/84
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	李金
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种语音处理方法、装置、设备及存储介质，先判断语音数据是否属于噪声，在语音数据不属于噪声的情况下，再对语音数据进行语音识别，除了得到语音识别结果外，还得到语音识别结果的置信度，判断语音识别结果是否属于目标场景对应的指令集，只有在语音识别结果属于目标场景对应的指令集，且置信度大于第一置信度阈值的情况下，才输出语音识别结果，通过多级判断，实现最大限度的噪声拒识。

技术领域

本申请涉及语音处理技术领域，更具体地说，涉及一种语音处理方法、装置、设备及存储介质。

背景技术

语音识别是一种利用机器学习将声音语言转成对应的文字语言的技术，使得机器具有像人类一样的听觉能力，是人工智能应用的一条重要的分支。随着人工智能技术的发展以及大量可用训练数据的累积，语音识别的准确率已达商用标准，已成功在各种智能终端设备上实现了大规模应用，给用户带来了更加便捷的体验，降低了人与机器的交互门槛。然而，在智能终端设备的交互场景中，常常会出现噪声被语音识别系统误识别出结果，带来了非常差的用户体验。

发明内容

有鉴于此，本申请提供了一种语音处理方法、装置、设备及存储介质，以提高噪声拒识效果。

为了实现上述目的，现提出的方案如下：

一种语音处理方法，所述方法包括：

对语音数据进行噪声判别；

若噪声判别结果表征所述语音数据不属于噪声，对所述语音数据进行语音识别，获得语音识别结果和所述语音识别结果的置信度；

判断所述语音识别结果是否属于目标场景对应的指令集；

若所述语音识别结果属于所述目标场景对应的指令集，且所述置信度大于第一置信度阈值，输出所述语音识别结果。

上述方法，可选的，还包括：

若所述语音识别结果不属于所述目标场景对应的指令集，输出所述语音识别结果。

上述方法，可选的，所述对语音数据进行噪声判别，包括：

提取所述语音数据的声学特征；