[发明专利]控制装置、语音交互装置、语音识别服务器以及存储介质有效
申请号: | 201911225321.0 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111354351B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 渡部生圣 | 申请(专利权)人: | 丰田自动车株式会社 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 韩峰;孙志湧 |
地址: | 日本爱知*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 装置 语音 交互 识别 服务器 以及 存储 介质 | ||
1.一种控制系统,包括:
中央处理单元,所述中央处理单元被配置成控制语音交互系统,所述语音交互系统包括存储器和保持在所述存储器中的多个语音识别模型,
其中,
所述多个语音识别模型包括:从所述多个语音识别模型当中已被暂时选择的初始语音识别模型,一个或多个中间语音识别模型,以及所述多个语音识别模型当中的被估计为最佳的最佳语音识别模型;
当与对象者的会话开始时,所述中央处理单元指示所述语音交互系统来通过所述初始语音识别模型首先执行语音识别和响应生成,基于在语音识别服务器中的由所述对象者发出的话语的所述语音识别的结果来确定所述最佳语音识别模型,并且当所述最佳语音识别模型和所述初始语音识别模型彼此不同时,指示所述语音交互系统以将所述语音识别模型切换成所述最佳语音识别模型并且执行语音识别和响应生成;以及
当所述语音交互系统从所述初始语音识别模型切换成所述最佳语音识别模型时,所述中央处理单元促使所述语音交互系统从所述初始语音识别模型按阶段地通过所述一个或多个中间语音识别模型以相似度的降序切换到所述最佳语音识别模型。
2.根据权利要求1所述的控制系统,其中,
所述初始语音识别模型是基于过去的会话信息而在所述语音交互系统中包括的所述多个语音识别模型当中的已经被确定为最频繁使用的语音识别模型。
3.根据权利要求1所述的控制系统,其中,
当所述中央处理单元使确定了被估计为最佳的所述语音识别模型时,所述中央处理单元使考虑除了关于所述对象者的语音之外的信息。
4.一种语音交互系统,包括:
多个语音识别模型,以及
控制器,
其中,
所述多个语音识别模型包括:从所述多个语音识别模型当中已被暂时选择的初始语音识别模型,一个或多个中间语音识别模型,以及所述多个语音识别模型当中的被估计为最佳的最佳语音识别模型;
当与对象者的会话开始时,所述控制器通过所述初始语音识别模型来首先执行语音识别和响应生成,基于在语音识别服务器中的由所述对象者发出在话语的所述语音识别的结果来确定所述最佳语音识别模型,当所述最佳语音识别模型和所述初始语音识别模型彼此不同时,从所述初始语音识别模型通过所述一个或多个中间语音识别模型以相似度的降序切换到所述最佳语音识别模型,将所述语音识别模型切换成所述最佳语音识别模型,并且所述最佳语音识别模型执行语音识别和响应生成。
5.一种控制语音交互系统的方法,所述语音交互系统包括多个语音识别模型,
所述多个语音识别模型包括:从所述多个语音识别模型当中已被暂时选择的初始语音识别模型,一个或多个中间语音识别模型,以及所述多个语音识别模型当中的被估计为最佳的最佳语音识别模型,
所述方法包括以下步骤:
当与对象者的会话开始时,指示所述语音交互系统来通过所述初始语音识别模型首先执行语音识别和响应生成;
基于在语音识别服务器中的由所述对象者发出的话语的所述语音识别的结果来确定所述最佳语音识别模型;
当所述最佳语音识别模型和所述初始语音识别模型彼此不同时,指示所述语音交互系统以将所述语音识别模型切换成所述最佳语音识别模型并且执行语音识别和响应生成;以及
当所述语音交互系统从所述初始语音识别模型切换成所述最佳语音识别模型时,促使所述语音交互系统从所述初始语音识别模型按阶段地通过所述一个或多个中间语音识别模型以相似度的降序切换到所述最佳语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰田自动车株式会社,未经丰田自动车株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911225321.0/1.html,转载请声明来源钻瓜专利网。