[发明专利]基于第三方代理内容的语音到文本转换有效
申请号: | 201780076180.3 | 申请日: | 2017-09-21 |
公开(公告)号: | CN110050303B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 巴纳比·詹姆斯;王波;苏尼尔·韦缪里;大卫·谢勒;乌拉什·基拉兹吉;埃尔坦·多鲁尔坦;彼塔尔·阿列克西克 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 第三 代理 内容 语音 文本 转换 | ||
实施方式涉及动态地并且以上下文敏感的方式偏置语音到文本转换。在一些实施方式中,语音到文本转换的偏置由本地代理的语音到文本引擎执行,并且偏置至少部分地基于由与本地代理网络通信的第三方(3P)代理提供给本地代理的内容。在这些实施方式中的一些实施方式中,内容包括由3P代理提供的上下文参数结合在以下的对话期间由3P代理生成的响应内容:3P代理与支持语音的电子设备的用户之间;并由本地代理协助。上下文参数指示待响应于由3P代理生成的响应内容而提供的另外的语音输入的潜在特征。本文所述的实施方式减少了各种计算资源的使用,否则这些计算资源可能被语音输入的不准确表示所消耗(例如,可能由校正语音输入的不准确表示所必需的附加“回合”所消耗的网络流量)。
背景技术
诸如智能电话、车辆计算系统、可穿戴设备、平板电脑和独立语音激活扬声器的支持语音的电子设备正变得越来越普遍。支持语音的电子设备通常包括“本地”代理和/或与之网络通信,该“本地”代理促进用户与设备的基于语音的交互的各个方面。本地代理可以经由支持语音的电子设备本身和/或经由与支持语音的电子设备网络通信的一个或多个远程计算设备(例如,“云”中的计算设备)来实现。
本地代理在以下意义上是“本地的”:其直接接收经由支持语音的电子设备提供的语音输入(例如,人类语音的流媒体音频录音),至少初始地处理所接收的语音输入,并且提供响应于所接收的语音输入的输出以经由电子设备(例如,可听和/或图形的)呈现。例如,本地代理可以通过至少执行将语音输入转换为文本的语音到文本(也称为话音到文本)转换来初始地处理所接收的语音输入。还例如,本地代理可以进一步提供响应于该语音输入的输出。例如,本地代理本身可以生成响应内容,并且生成基于该响应内容的输出。
发明内容
本说明书通常涉及动态地并且以上下文敏感的方式偏置语音到文本转换的各种实施方式。语音到文本转换是对应的语音输入中的每一个,其基于对应的用户的口头输入并且由支持语音的电子设备(在本文中也被称为“电子设备”)的麦克风和/或其他换能器捕获。
在各种实施方式中,语音到文本转换的偏置由本地代理的语音到文本引擎执行,并且偏置至少部分地基于由与本地代理网络通信的第三方(3P)代理提供给本地代理的内容。在这些实施方式中的一些实施方式中,内容包括由3P代理提供的上下文参数结合在以下的对话期间由3P代理生成的响应内容:在3P代理与支持语音的电子设备的用户之间;并由本地代理协助。上下文参数指示待响应于由3P代理生成的响应内容而提供的另外的语音输入的潜在特征。
作为一个示例,本地代理可以与电子设备和3P代理两者网络通信。在促进3P代理与电子设备的用户之间的对话中,本地代理可以执行下述的一次或多次迭代:从电子设备接收语音输入;(可选地,基于3P代理提供上下文参数的最新迭代)将语音输入转换为文本;将至少部分转换后的文本(以及可选的附加内容)传送到3P代理;响应于该传送,从3P代理接收响应内容(以及可选地,动态更新的上下文参数);并且提供基于响应内容的输出(例如,当响应内容是文本格式时,执行文本到语音转换,并且将转换后的语音输出提供给电子设备以可听的呈现)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780076180.3/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法