[发明专利]语音识别方法、装置、介质及电子设备有效

申请号：	201910877191.2	申请日：	2019-09-17
公开（公告）号：	CN110503956B	公开（公告）日：	2023-05-12
发明（设计）人：	王健宗;彭俊清;瞿晓阳	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26
代理公司：	深圳市联鼎知识产权代理有限公司 44232	代理人：	孙强
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及自然语言处理领域，揭示了一种语音识别方法、装置、介质及电子设备。该方法包括：将音频数据输入语音识别模型，得到输出的初步识别结果；确定初步识别结果中文本单位对应的音频数据中的音频片段；针对每一文本单位，若该文本单位对应音频片段的声压满足预定条件，则将初步识别结果中该文本单位替换为占位符，得到中间结果；确定中间结果与预设标准文本库中各标准文本序列的匹配度；基于匹配度，在标准文本库的各标准文本序列中选出目标标准文本序列作为最终识别结果。此方法下，降低了由于对应的音频片段的声压不符合一定要求的文本单位的存在所导致的语音识别不准确的可能性，提高了语音识别的准确率。

背景技术

随着移动互联网的发展，包括语音识别在内的与自然语言处理相关技术获得了蓬勃发展。目前，为了实现语音识别，人们常构建语音识别模型，然后将用户输入的语音数据输入至语音识别模型，语音识别模型会输出相应的文本信息，从而完成语音识别。

然而，一般人说话时不可能像播音那样说话，导致句子中的某些词的音量无法满足语音识别的特定需求。这样，单纯使用语音识别模型就无法准确识别出正确的内容，从而降低了语音识别的准确率。

发明内容

在自然语言处理技术领域，为了解决上述技术问题，本公开的目的在于提供一种语音识别方法、装置、介质及电子设备。

根据本申请的一方面，提供了一种语音识别方法，所述方法包括：

将获取的音频数据输入至预先建立的语音识别模型，得到所述语音识别模型输出的文本形式的初步识别结果；

确定所述初步识别结果中每一文本单位对应的所述音频数据中的音频片段；

针对所述初步识别结果中每一文本单位，若该文本单位对应的音频片段的声压满足预定条件，则将所述初步识别结果中的该文本单位替换为占位符，得到与所述初步识别结果对应的中间结果；

确定所述中间结果与预设的标准文本库中的每一标准文本序列的匹配度；

基于所述匹配度，在所述标准文本库的各标准文本序列中选出目标标准文本序列作为最终识别结果。

根据本申请的另一方面，提供了一种语音识别装置，所述装置包括：