[发明专利]训练至少部分语音命令系统有效
申请号: | 201480011152.X | 申请日: | 2014-03-14 |
公开(公告)号: | CN105027197B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | D·W·皮特谢尔;A·J·彻耶;C·D·布里格汉姆;T·R·格鲁伯 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;H04M3/493 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 至少 部分 语音 命令 系统 | ||
1.一种在电子设备处执行的用于训练数字助理的计算机实现的方法,所述电子设备包括一个或多个处理器和存储由所述一个或多个处理器执行的指令的存储器,所述方法包括:
检测所述数字助理和用户之间的对话期间的僵局,其中所述对话包括来自所述用户的至少一个语音输入,其中所述至少一个语音输入包括多个字词;
响应于检测到所述僵局,建立与所述至少一个语音输入相关联的学习会话;
在所述学习会话期间:
接收来自所述用户的一个或多个后续澄清输入;至少部分地基于所述一个或多个后续澄清输入,
调整与所述至少一个语音输入相关联的意图推断和任务执行中的至少一者,以生成对所述至少一个语音输入的令人满意的响应;以及
使所述令人满意的响应与整个所述至少一个语音输入相关联,以用于处理所述至少一个语音输入的未来出现,其中所述关联包括:用来自所述用户的对所述至少一个语音输入的所述令人满意的响应替代由用户社区中的一组用户共享的相应初始响应。
2.根据权利要求1所述的方法,其中检测所述僵局包括:
在所述数字助理和所述用户之间的所述对话期间:
接收来自所述用户的至少一个语音输入;
基于所述至少一个语音输入来推断初始意图;
提供初始响应来满足已推断出的所述初始意图;以及
接收来自所述用户的拒绝所述初始响应的跟进语音输入。
3.根据权利要求2所述的方法,其中所述初始意图是最佳猜测;
并且在所述学习会话期间,所述方法还包括:
在接收来自所述用户的所述一个或多个后续澄清输入之前,基于所述至少一个语音输入来推断第二意图,其中所述第二意图是第二最佳猜测,并且所述第二意图不同于所述初始意图;以及
提供第二响应来满足已推断出的所述第二意图。
4.根据权利要求1所述的方法,其中所述僵局包括由以下各项组成的组中的一者:
与所述令人满意的响应不同的初始响应的单次用户拒绝;所述初始响应的两次或更多次用户拒绝;和
结束所述对话的用户命令。
5.根据权利要求1所述的方法,还包括:
在所述学习会话期间:
在接收来自所述用户的所述一个或多个后续澄清输入之前,提供对来自所述用户的所述至少一个语音输入的两个或更多个另选的响应。
6.根据权利要求1所述的方法,还包括:
在所述学习会话期间:
降低相应意图推断或语音识别阈值,以便生成对来自所述用户的所述至少一个语音输入的两个或更多个另选的响应。
7.根据权利要求1所述的方法,还包括:
在所述学习会话期间:
在接收来自所述用户的所述一个或多个后续澄清输入之前,对来自所述用户的所述至少一个语音输入的至少一部分进行改述,以引出来自所述用户的一个或多个后续澄清输入。
8.一种电子设备,包括:
被配置为接收声音输入的声音接收单元;被配置为输出声音的扬声器单元;和
耦接到所述声音接收单元和所述扬声器单元的处理单元,所述处理单元被配置为:
检测数字助理和用户之间的对话期间的僵局,其中所述对话包括来自所述用户的至少一个语音输入,其中所述至少一个语音输入包括多个字词;
响应于检测到所述僵局,建立与所述至少一个语音输入相关联的学习会话;
在所述学习会话期间:
接收来自所述用户的一个或多个后续澄清输入;至少部分地基于所述一个或多个后续澄清输入,调整与所述至少一个语音输入相关联的意图推断和任务执行中的至少一者,以生成对所述至少一个语音输入的令人满意的响应;以及
使所述令人满意的响应与整个所述至少一个语音输入相关联,以用于处理所述至少一个语音输入的未来出现,其中所述关联包括:用来自所述用户的对所述至少一个语音输入的所述令人满意的响应替代由用户社区中的一组用户共享的相应初始响应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480011152.X/1.html,转载请声明来源钻瓜专利网。