[发明专利]一种自动切换语种方法、装置、系统、设备和存储介质在审
申请号: | 202010766838.7 | 申请日: | 2020-08-03 |
公开(公告)号: | CN111798836A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 范红亮;李旭滨 | 申请(专利权)人: | 上海茂声智能科技有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/22 |
代理公司: | 上海领誉知识产权代理有限公司 31383 | 代理人: | 车超平;王琰 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 切换 语种 方法 装置 系统 设备 存储 介质 | ||
本申请涉及一种自动切换语种方法、装置、系统、设备及存储介质,该方法包括获取唤醒语音数据;对唤醒语音数据进行处理,以获得唤醒词、唤醒语音片段;识别唤醒词和/或唤醒语音片段,以获得识别语种类型;在识别语种类型与当前语种类型不同的情况下,切换当前语种类型识别语种类型,解决了无法进行多语种切换识别的问题,实现了自动切换语种识别模型的技术效果。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种自动切换语种方法、装置、系统、设备和存储介质。
背景技术
针对一些多语种的语音识别场景,需要根据说话者的语种情况,选择合适语音识别引擎,从而达到最佳的语音识别效果。
在相关技术中,通常有两种方式来满足多语种的识别需求。第一种方式是训练多语种混合识别模型;第二种方式是每个语种都针对性地训练该语种的语音识别模型,每个语种均具有其独立的语音识别引擎进行识别。
然而上述方式均具有缺陷。对于第一种方式而言,虽然直接训练多语种混合识别模型简单方便,但是其识别准确率低、识别效果差,无法对每个语种都有较高的识别准确率、较好的识别效果,而且,不同语种之间的识别会相互干扰。对于第二种方式而言,虽然每个语种的语音识别模型对该语种的识别准确率高、识别效果好,但是无法针对说话人选择合适的语音识别模型进行识别。
为了解决第二种方式的缺陷,在相关技术中,通常会配置一个语种选择选项(语种选择菜单),在识别之前先选择对应的语音识别模型,然后再进行识别。但是这种方法仍然存在缺陷,如只能适用于单一语种环境,无法在多语种环境下进行识别;需要人工选择,操作繁琐。
目前针对相关技术中无法进行多语种切换识别的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种自动切换语种方法、装置、系统、设备和存储介质,以至少解决相关技术中无法进行多语种切换识别的问题。
第一方面,本申请实施例提供了一种自动切换语种方法,包括:
获取唤醒语音数据;
对所述唤醒语音数据进行处理,以获得唤醒词、唤醒语音片段;
识别所述唤醒词和/或所述唤醒语音片段,以获得识别语种类型;
在所述识别语种类型与当前语种类型不同的情况下,切换所述当前语种类型为所述识别语种类型。
在其中的一些实施例中,在切换所述当前语种类型为所述识别语种类型之后,所述方法还包括:
选择与所述识别语种类型相对应的语音识别引擎;
使用所述语音识别引擎对所述唤醒语音数据进行识别,以生成唤醒语音识别结果。
在其中的一些实施例中,识别所述唤醒词和/或所述唤醒语音片段,以获得识别语种类型包括:
识别若干所述唤醒词,以获得若干第一识别语种类型;
统计若干所述第一识别语种类型的次数;
在一所述第一识别语种类型的次数最多的情况下,将该所述第一识别语种类型作为识别语种类型。
在其中的一些实施例中,识别所述唤醒词和/或所述唤醒语音片段,以获得识别语种类型包括:
识别若干所述唤醒语音片段,以获得若干第二识别语种类型;
统计若干所述第二识别语种类型的次数;
在一所述第二识别语种类型的次数最多的情况下,将该所述第二识别语种类型作为识别语种类型。
在其中的一些实施例中,识别所述唤醒词和/或所述唤醒语音片段,以获得识别语种类型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海茂声智能科技有限公司,未经上海茂声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010766838.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种单煤气分级燃烧器
- 下一篇:一种多体制调制器