[发明专利]一种自动切换语种方法、装置、系统、设备和存储介质在审

申请号：	202010766838.7	申请日：	2020-08-03
公开（公告）号：	CN111798836A	公开（公告）日：	2020-10-20
发明（设计）人：	范红亮;李旭滨	申请（专利权）人：	上海茂声智能科技有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/22
代理公司：	上海领誉知识产权代理有限公司 31383	代理人：	车超平;王琰
地址：	201306 上海***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种自动切换语种方法装置系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种自动切换语种方法、装置、系统、设备及存储介质，该方法包括获取唤醒语音数据；对唤醒语音数据进行处理，以获得唤醒词、唤醒语音片段；识别唤醒词和/或唤醒语音片段，以获得识别语种类型；在识别语种类型与当前语种类型不同的情况下，切换当前语种类型识别语种类型，解决了无法进行多语种切换识别的问题，实现了自动切换语种识别模型的技术效果。

技术领域

本申请涉及语音识别技术领域，特别是涉及一种自动切换语种方法、装置、系统、设备和存储介质。

背景技术

针对一些多语种的语音识别场景，需要根据说话者的语种情况，选择合适语音识别引擎，从而达到最佳的语音识别效果。

在相关技术中，通常有两种方式来满足多语种的识别需求。第一种方式是训练多语种混合识别模型；第二种方式是每个语种都针对性地训练该语种的语音识别模型，每个语种均具有其独立的语音识别引擎进行识别。

然而上述方式均具有缺陷。对于第一种方式而言，虽然直接训练多语种混合识别模型简单方便，但是其识别准确率低、识别效果差，无法对每个语种都有较高的识别准确率、较好的识别效果，而且，不同语种之间的识别会相互干扰。对于第二种方式而言，虽然每个语种的语音识别模型对该语种的识别准确率高、识别效果好，但是无法针对说话人选择合适的语音识别模型进行识别。

为了解决第二种方式的缺陷，在相关技术中，通常会配置一个语种选择选项(语种选择菜单)，在识别之前先选择对应的语音识别模型，然后再进行识别。但是这种方法仍然存在缺陷，如只能适用于单一语种环境，无法在多语种环境下进行识别；需要人工选择，操作繁琐。

目前针对相关技术中无法进行多语种切换识别的问题，尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种自动切换语种方法、装置、系统、设备和存储介质，以至少解决相关技术中无法进行多语种切换识别的问题。

第一方面，本申请实施例提供了一种自动切换语种方法，包括：

获取唤醒语音数据；

对所述唤醒语音数据进行处理，以获得唤醒词、唤醒语音片段；

识别所述唤醒词和/或所述唤醒语音片段，以获得识别语种类型；

在所述识别语种类型与当前语种类型不同的情况下，切换所述当前语种类型为所述识别语种类型。

在其中的一些实施例中，在切换所述当前语种类型为所述识别语种类型之后，所述方法还包括：

选择与所述识别语种类型相对应的语音识别引擎；

使用所述语音识别引擎对所述唤醒语音数据进行识别，以生成唤醒语音识别结果。