[发明专利]多语种语音交互方法和装置有效
申请号: | 202011162634.9 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112002325B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 宋泽;甘津瑞;邓建凯 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/00;G10L15/18 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语种 语音 交互 方法 装置 | ||
1.一种多语种语音交互方法,用于客户端,包括:
响应于获取的音频,将所述音频送入混合语言模型进行识别,其中,所述混合语言模型中训练了多种语种的切换语种命令词并存储在本地;
基于所述混合语言模型的识别结果,判断所述音频中是否存在切换语种命令词;
若存在切换语种命令词,基于所述切换语种命令词确定切换后的语种;
基于所述切换后的语种设置在线默认语言模型并将所述在线默认语言模型同步至服务端,其中,所述服务端包括多种单一语言模型。
2.根据权利要求1所述的方法,其中,所述判断所述音频中是否存在切换语种命令词,还包括:
若判断所述音频中不存在切换语种命令词,结束切换语种指令。
3.一种多语种语音交互方法,用于服务端,包括:
响应于获取的音频,将所述音频送入第一单一语言模型进行识别,其中,所述服务端训练了多个单一语言模型;
对所述第一单一语言模型的识别结果进行后续处理,其中,所述后续处理包括语义处理和对话处理。
4.根据权利要求3所述的方法,其中,在所对所述识别结果进行后续处理之后,还包括:
判断是否收到客户端发送的在线默认语言模型同步指令;
若收到,判断所述在线默认语言模型同步指令中的第二单一语言模型是否与所述服务端当前的第一单一语言模型一致;
若不一致,将所述第一单一语言模型切换至所述第二单一语言模型。
5.根据权利要求4所述的方法,其中,所述判断是否收到所述客户端发送的切换单一语言模型指令在线默认语言模型同步指令,还包括:
若没有收到所述客户端发送的在线默认语言模型同步指令,输出对所述识别结果进行后续处理后的处理结果。
6.根据权利要求4所述的方法,其中,在所述判断所述在线默认语言模型同步指令中的第二单一语言模型是否与所述服务端当前的第一单一语言模型一致之后,还包括:
若所述第二单一语言模型与所述第一单一语言模型一致,输出对话结果。
7.一种多语种语音交互装置,用于客户端,包括:
第一获取识别模块,配置为响应于获取的音频,将所述音频送入混合语言模型进行识别,其中,所述混合语言模型中训练了多种语种的切换语种命令词并存储在本地;
判断模块,配置为基于所述混合语言模型的识别结果,判断所述音频中是否存在切换语种命令词;
切换模块,配置为若存在切换语种命令词,基于所述切换语种命令词确定切换后的语种;
设置同步模块,配置为基于所述切换后的语种设置在线默认语言模型并将所述在线默认语言模型同步至服务端,其中,所述服务端包括多种单一语言模型。
8.一种多语种语音交互装置,用于服务端,包括:
第二获取识别模块,配置为响应于获取的音频,将所述音频送入第一单一语言模型进行识别,其中,所述服务端训练了多个单一语言模型;
处理模块,配置为对所述第一单一语言模型的识别结果进行后续处理,其中,所述后续处理包括语义处理和对话处理。
9.一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行权利要求1至6中任一项所述方法的步骤。
10.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011162634.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑装饰材料的检测装置
- 下一篇:一种智能防盗门锁及开锁方法