[发明专利]利用事件前和事件后输入流来接洽自动化助理在审
申请号: | 201980091402.8 | 申请日: | 2019-02-20 |
公开(公告)号: | CN114041283A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 马修·谢里菲;汤姆·休姆;穆罕默德·哈桑·罗姆;扬·奥尔索斯;迭戈·米伦多·卡萨多 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | H04M3/527 | 分类号: | H04M3/527;G10L15/18;G06F3/16;G10L15/22;H04M3/493;G10L17/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 事件 输入 接洽 自动化 助理 | ||
1.一种使用一个或多个处理器实施的方法,包括:
至少部分地在由用户操作的计算设备上执行处于不活跃监听状态的自动化助理;
在处于所述不活跃监听状态时,检测触发将所述自动化助理从所述不活跃监听状态转变为活跃监听状态的事件,其中,指示由一个或多个麦克风在所述事件之前捕捉到的声音的第一数据作为事件前输入流被暂时存储在由所述用户操作的所述计算设备的存储器缓冲区中;
获得指示由所述麦克风中的一个或多个在检测到所述事件之后捕捉到的声音的第二数据作为事件后输入流;
在处于所述活跃监听状态时,针对触发由所述自动化助理进行的响应动作来确定事件前和事件后输入流的相应的适合性度量;
基于所述相应的适合性度量,选择所述事件前输入流或所述事件后输入流;以及
基于所选择的输入流来使所述自动化助理执行一个或多个响应动作。
2.根据权利要求1所述的方法,进一步包括针对一个或多个热词监测由所述麦克风中的一个或多个捕捉到的声音,其中,触发将所述自动化助理从所述不活跃监听状态转变为所述活跃监听状态的所述事件包括在所述监测期间检测所述热词中的一个或多个。
3.根据权利要求2所述的方法,进一步包括对由所述一个或多个麦克风捕捉到的所述声音的至少一部分执行说话者辨识处理,以确定所述用户的身份,其中,将所述自动化助理从所述不活跃监听状态转变为所述活跃监听状态是进一步响应于确定所述用户的所述身份满足一个或多个准则而被触发的。
4.根据权利要求3所述的方法,其中,所述一个或多个准则包括所述用户的所述身份与所述计算设备的所有者匹配。
5.根据权利要求2所述的方法,其中,所述监测是使用与由所述用户操作的所述计算设备集成的数字信号处理器来执行的。
6.根据权利要求5所述的方法,其中,所述数字信号处理器与数字信号处理芯片集成,以及其中,所述存储器缓冲区包括所述数字信号处理芯片机载的数字信号处理缓冲区。
7.根据权利要求2所述的方法,其中,所述热词中的一个或多个是代词,并且所述方法进一步包括将所述代词消解为从所选择的输入流中提取的一个或多个令牌。
8.根据权利要求1所述的方法,其中,所述存储器缓冲区包括被新捕捉到的音频数据周期性重写的循环存储器缓冲区。
9.根据权利要求1所述的方法,其中,所述存储器缓冲区被配置为暂时存储在预定时间间隔内捕捉到的音频数据。
10.根据权利要求1所述的方法,其中,确定所述相应的适合性度量包括确定所述事件前和事件后输入流与一个或多个已知命令句法之间的相应的相似度度量。
11.根据权利要求10所述的方法,其中,确定所述相应的适合性度量包括在所述事件前和事件后输入流中的一个或两者中分析所述用户的语音的一个或多个特征。
12.根据权利要求11所述的方法,其中,所述分析包括将所述用户的语音的所述一个或多个特征与从包含针对自动化助理的命令的话语中观察到的一个或多个语音特征进行比较。
13.根据权利要求11所述的方法,其中,所述分析包括将所述用户的语音的所述一个或多个特征作为输入应用于机器学习模型上,其中,所述机器学习模型被训练以生成输出,所述输出指示所述输入是否指向自动化助理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980091402.8/1.html,转载请声明来源钻瓜专利网。