[发明专利]利用本地文本响应映射呈现对用户的口头话语的响应在审
申请号: | 201880094598.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN112334976A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 高宇立;成相洙 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30;G10L15/26 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;任庆威 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 本地 文本 响应 映射 呈现 用户 口头 话语 | ||
1.一种由客户端设备的一个或多个处理器实施的方法,所述方法包括:
经由所述客户端设备的至少一个麦克风捕获音频数据,所述音频数据捕获用户的口头话语;
处理所述音频数据以生成对应于所述口头话语的当前文本,其中,处理所述音频数据以生成所述当前文本利用在所述客户端设备上本地存储的语音到文本模型;
访问在所述客户端设备上本地存储的文本响应映射,其中,所述文本响应映射包括多个映射,所述映射中的每一个映射基于先前根据由所述客户端设备捕获的先前的音频数据生成的相对应的文本并且基于先前响应于向远程系统传输所述先前的音频数据和所述相对应的文本中的至少一个而从所述远程系统接收的相对应的响应来定义所述相对应的文本和所述相对应的响应之间的相对应的直接关系;
确定所述文本响应映射的相对应的文本中的任何一个是否与所述当前文本相匹配;以及
响应于确定所述文本响应映射的相对应的文本中的给定文本与所述当前文本相匹配:
选择所述文本响应映射的相对应的响应中的给定响应,其中,选择所述给定响应是基于包括所述映射中的将所述给定响应定义为与所述给定文本具有直接关系的映射的所述文本响应映射;以及
使得所述给定响应经由与所述客户端设备相关联的一个或多个用户界面输出设备被呈现。
2.根据权利要求1所述的方法,还包括:
将所述音频数据或所述当前文本传输到所述远程系统;
响应于传输所述音频数据或所述当前文本,从所述远程系统接收响应于所述口头话语的服务器响应;
将所述服务器响应与所述给定响应进行比较;以及
基于所述比较来更新所述文本响应映射。
3.根据权利要求2所述的方法,其中,接收所述服务器响应发生在所述给定响应的至少一部分已经经由所述一个或多个用户界面输出设备被呈现之后。
4.根据权利要求2或权利要求3所述的方法,其中,将所述服务器响应与所述给定响应进行比较指示所述服务器响应不同于所述给定响应,并且其中,更新所述文本响应映射包括:
基于指示所述服务器响应不同于所述给定响应的比较:
更新将所述给定响应定义为与所述给定文本具有所述直接关系的映射,以将所述服务器响应定义为与所述给定文本具有所述直接关系。
5.根据权利要求2或权利要求3所述的方法,其中,将所述服务器响应与所述给定响应进行比较指示所述服务器响应不同于所述给定响应,并且其中,更新所述文本响应映射包括:
基于指示所述服务器响应不同于所述给定响应的比较:
从所述文本响应映射中移除将所述给定响应定义为与所述给定文本具有所述直接关系的映射。
6.根据权利要求5所述的方法,其中,更新所述文本响应映射还包括:
基于指示所述服务器响应不同于所述给定响应的比较:
在所述文本响应映射中存储防止所述给定文本被映射到任何响应的数据。
7.根据权利要求2或权利要求3所述的方法,其中,更新所述文本响应映射包括调整与将所述给定响应定义为与所述给定文本具有所述直接关系的映射相关联的置信度得分。
8.根据权利要求7所述的方法,其中,调整与将所述给定响应定义为与所述给定文本具有所述直接关系的映射相关联的所述置信度得分包括:
如果所述比较指示所述给定响应与所述服务器响应相匹配,则将所述置信度得分调整为更多地指示置信度。
9.根据权利要求7所述的方法,其中,选择所述给定响应还基于与所述映射相关联的置信度得分满足阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880094598.1/1.html,转载请声明来源钻瓜专利网。