[发明专利]一种语音识别方法、装置、设备、介质及产品在审

申请号：	202210152963.8	申请日：	2022-02-18
公开（公告）号：	CN114678018A	公开（公告）日：	2022-06-28
发明（设计）人：	姚佳立;王心怡;杨晶生	申请（专利权）人：	北京字跳网络技术有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/06;G10L15/26;G10L15/30
代理公司：	北京信远达知识产权代理有限公司 11304	代理人：	储倩
地址：	100190 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置设备介质产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种语音识别方法、装置、设备、介质及产品，涉及语音识别技术领域，该方法包括获取待识别语音，根据该待识别语音，确定待识别语音的第一转写文本；当所述第一转写文本中的关键词在错误关键词集合中命中时，对所述第一转写文本进行语义修复；所述错误关键词集合包括相同语音对应的多个关键词。该方法中，通过错误关键词集合，对第一转写文本进行语义修复，从而提高了对含有专业术语的关键词的语音进行识别的准确率，满足业务需求。

技术领域

本公开涉及语音识别技术领域，尤其涉及一种语音识别方法、装置、设备、计算机可读存储介质以及计算机程序产品。

背景技术

随着语音识别技术的不断发展，自动语音识别(automated speech recognition，ASR) 技术被广泛应用，例如，语音识别模型，基于该语音识别模型对语音进行转写得到相应的文本，从而提供便利性。

目前，在即时通讯应用中，通过语音识别模型，可以将语音转为文本，使得用户无需打字即可获得相应的文本；在会议应用中，通过语音识别模型，自动生成会议语音对应的文本，进而便捷地生成会议记录。

然而，待识别语音中可能包含专业术语，例如“我们debug一下这个系统”的语音，其中，“debug”为专业术语，语音识别模型对该含有专业术语的语音进行识别时，往往得到“我们第八个一下这个系统”。可见，对含有专业术语的语音进行识别，得到的识别结果的准确率较差。

发明内容

本公开的目的在于：提供了一种语音识别方法、装置、设备、计算机可读存储介质以及计算机程序产品，能够提高对含有专业术语的语音进行识别的准确率，满足业务需求。

第一方面，本公开提供了一种语音识别方法，包括：

获取待识别语音；

根据所述待识别语音，确定所述待识别语音的第一转写文本；

当所述第一转写文本中的关键词在错误关键词集合中命中时，对所述第一转写文本进行语义修复；所述错误关键词集合包括相同语音对应的多个关键词。