[发明专利]协作性语音控制装置在审

专利信息
申请号: 202210102465.2 申请日: 2017-09-30
公开(公告)号: CN114566161A 公开(公告)日: 2022-05-31
发明(设计)人: 维克托·克尔布内;佩德罗·戈内·安德斯;托马斯·德泽莱斯;桑德罗·弗兹 申请(专利权)人: 谷歌有限责任公司
主分类号: G10L15/22 分类号: G10L15/22;G10L15/08;G10L13/033
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 周亚荣;邓聪惠
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 协作 语音 控制 装置
【说明书】:

本公开涉及一种协作性语音控制装置。公开了包括用于在多个语音控制装置之间协作的在计算机存储介质上编码的计算机程序的方法、系统和装置。在一个方面,一种方法包括以下动作:由第一计算装置识别被配置成响应于特定的、预定义热词的第二计算装置;接收与话语相对应的音频数据;接收第二计算装置响应于该话语而输出的附加音频数据的转录;基于附加音频数据的转录并且基于话语,生成与附加音频数据的响应相对应的转录;并且提供与响应相对应的转录供输出。

分案说明

本申请属于申请日为2017年9月30日的中国发明专利申请201710918710.6的分案申请。

技术领域

本说明书总体上涉及一种自动语音识别。

背景技术

我们正处于现实启用语音的家庭或其他环境(也就是说,用户只需要大声说出查询或命令的环境并且基于计算机的系统将现场回答查询和/或致使命令被执行的现实)。可以使用分布于整个环境的各个房间或区域中的相连麦克风装置的网络来实现启用语音的环境(例如,家庭、工作场所、学校等)。通过这样的麦克风网络,在不需要在他/她之前或甚至附近有计算机或其他装置的情况下,用户能够从环境中的基本任何地方口头询问系统。例如,当正在厨房烹饪时,用户可能问系统“三杯中有多少毫升”,并且作为响应,例如以合成语音输出的形式从系统接收答案。可替选地,用户可能问系统诸如“离我最近的加油站什么时间关门”或准备离开房子时的“我今天应该穿外套吗?”的问题。另外,用户会询问系统的查询和/或发出与用户个人信息相关的命令。例如,用户会问系统“我何时与约翰会面?”或命令系统“当我回家时提醒我打电话给约翰。”

发明内容

可以使用热词来避免拾取没有涉及系统的周围环境中发出的话语。热词(也被称为“注意词”或“语音动作发起命令”)是说出的用于引起系统注意的预定词语或术语。在示例环境中,用于引起系统注意的热词是词语“好的,计算机”。当系统检测到用户已经说出该热词时,系统进入就绪状态,以便接收进一步的用户命令。

在启用语音的环境中,装置会连续监听热词。当相同环境中存在多个装置被配置成响应于特定的热词时,包括该热词的任何话语都可以触发所有装置并且提供来自这些多个装置的冗余响应。例如,Alice、Bob和Carl可能正在查找一家餐厅去吃午餐。Alice会说“好的,计算机,查找我附近的餐厅”。他们的三个电话全都可以同时地提供响应,例如,餐厅的列表。为了改善用户体验,可能期望电话彼此通信,以与实际对话类似的协作方式来提供不同的响应。Alice的电话可以提供附近餐厅的列表,Bob的电话可以提供选择由Alice电话提供的附近餐厅列表中的餐厅之一的响应。卡尔的电话可以基于卡尔在社交媒体上对所选定餐厅的评论,提供认可该餐厅的响应。

根据本说明书中描述的主题的一个创新方面,第一计算装置识别被配置成响应于特定的、预定义热词的一个或更多个其他计算装置。第一计算装置接收由用户说出的话语。在对与该话语相对应的音频数据执行语音识别之前,第一计算装置确定音频数据包括热词,并且第二计算装置已经正在处理音频。第一计算装置响应于话语而接收由第二计算装置输出的响应。基于该响应和该话语,第一计算装置生成响应并提供该响应供输出。因此,第一计算装置增强来自第二计算装置的响应,并且提供能够向用户提供附加信息的新响应。

总体上,本说明书中描述的主题的另一种创新性方面可以在包括以下动作的方法中实施:由第一计算装置识别被配置成响应于特定的、预定义热词的第二计算装置;接收与话语相对应的音频数据;接收第二计算装置响应于该话语而输出的附加音频数据的转录;基于附加音频数据的所述转录并且基于话语,生成与对附加音频数据的响应相对应的转录;并且提供与所述响应相对应的转录进行输出。

这些和其他实施例均可以可选地包括以下特征中的一个或更多个。在一些实现方式中,提供与所述响应相对应的所述转录供输出包括:将所述转录的初始部分提供给所述第一计算装置的语音合成器;以及向所述第二计算装置提供(i)所述转录的剩余部分和(ii)用于使用所述第二计算装置的语音合成器来输出所述转录的剩余部分的指令。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210102465.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top