[发明专利]中英文混合语音识别方法、装置、电子设备和存储介质有效

申请号：	202011399785.6	申请日：	2020-12-01
公开（公告）号：	CN112652311B	公开（公告）日：	2021-09-03
发明（设计）人：	王知践;钱胜;张奇	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G10L15/32	分类号：	G10L15/32;G10L15/183;G10L15/00
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	韩海花
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	中英文混合语音识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种中英文混合语音识别方法、装置、电子设备和存储介质，涉及语音技术领域、自然语言处理领域、深度学习领域等人工智能领域。具体实现方案为：响应于接收到语音信息，确定语音信息的发音信息和语言模型得分；根据发音信息确定语音信息的内容中是否存在英文词；响应于语音信息的内容中存在英文词，基于预设的中英文映射表确定与英文词对应的中文词；确定与英文词对应的中文词的得分，将语言模型得分之中的英文词的得分替换成中文词的得分；根据替换后的语言模型得分，获取针对语音信息的语音识别结果。本申请实施例可以提高语言模型得分之中英文词所在路径的得分，从而可以提高中英文混合语音的整体识别效果。

技术领域

本申请涉及计算机技术领域，尤其涉及语音技术领域、自然语言处理领域、深度学习领域等人工智能领域，具体涉及一种中英文混合语音识别方法、装置、电子设备和存储介质。

背景技术

在众多语音识别的应用中均可能存在中英文混说的情形。例如，说话内容为“很高兴我们拿下了这个deal；这个事件的behavior对我们影响很大；”，这种因为一些中文发音的谐音其实也是根据英文词“deal”很像，比如迪欧、第二等等。相关技术中，通常是基于语音识别模型直接对这种中英文混合的语音进行识别和查分。但是，由于有中文谐音的词语的关系，同时语言模型区分度在这种谐音和英文词上差异不大，导致最终语音识别结果实际上出来的不一定如预期那样的英文词，存在识别效果差等问题。

发明内容

本申请提供了一种中英文混合语音识别方法、装置、电子设备以及存储介质。

根据本申请的第一方面，提供了一种中英文混合语音识别方法，包括：

响应于接收到语音信息，确定所述语音信息的发音信息和语言模型得分；

根据所述发音信息确定所述语音信息的内容中是否存在英文词；

响应于所述语音信息的内容中存在英文词，基于预设的中英文映射表确定与所述英文词对应的中文词；其中，所述中英文映射表中包含至少一对英文词与中文词的映射关系；

确定与所述英文词对应的中文词的得分，将所述语言模型得分之中的所述英文词的得分替换成所述中文词的得分；

根据替换后的语言模型得分，获取针对所述语音信息的语音识别结果。

根据本申请的第二方面，提供了一种中英文混合语音识别装置，包括：

第一确定模块，用于响应于接收到语音信息，确定所述语音信息的发音信息和语言模型得分；

第二确定模块，用于根据所述发音信息确定所述语音信息的内容中是否存在英文词；

第三确定模块，用于响应于所述语音信息的内容中存在英文词，基于预设的中英文映射表确定与所述英文词对应的中文词；其中，所述中英文映射表中包含至少一对英文词与中文词的映射关系；