[发明专利]直接从对话历史和资源中生成自动化助理响应和/或动作在审

专利信息
申请号: 202010590994.2 申请日: 2020-06-24
公开(公告)号: CN111737434A 公开(公告)日: 2020-10-02
发明(设计)人: 阿尔温德·尼拉坎坦;丹尼尔·杜克沃特;本·古德里奇;维沙尔·普拉萨德;希纳德胡赖·桑卡尔;塞米赫·亚武兹 申请(专利权)人: 谷歌有限责任公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/126;G06F40/216;G06F40/279;G06F9/451;G06N3/08;G10L15/22;G10L15/26;G10L15/16;G10L15/06
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 周亚荣;邓聪惠
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 直接 对话 历史 资源 生成 自动化 助理 响应 动作
【说明书】:

本公开涉及直接从对话历史和资源中生成自动化助理响应和/或动作。训练和/或利用单个神经网络模型在用户和自动化助理之间的对话会话的多个助理轮次中的每个轮次生成对应的自动化助理自然语言响应和/或对应的自动化助理动作。例如,在对话会话的给定助理轮次,可以联合并直接基于使用单个神经网络模型生成的输出来生成对应的自然语言响应和对应的动作。可以基于使用神经网络模型处理对话历史和多个离散资源来生成对应的响应和/或对应的动作。例如,神经网络模型可以用于逐个令牌地生成响应和/或动作。

技术领域

本公开涉及直接从对话历史和资源中生成自动化助理响应和/或动作。

背景技术

人们可以使用本文称为“自动化助理”(也称为“数字代理”、“交互式个人助理”、“智能个人助理”、“助理应用”、“会话代理”等)的交互式软件应用参与人机对话。例如,人类(当他们与自动化助理交互时他们可以称为“用户”)可以使用口头自然语言输入(即话语)和/或通过提供文本(例如,键入的)自然语言输入向自动化助理提供命令和/或请求,在某些情况下可以将口头自然语言输入(即话语)转换为文本然后对其进行处理。自动化助理通过提供响应用户界面输出和/或采取响应动作来响应请求。响应用户界面输出可以包括自然语言输出,其可以可选地被转换为合成话音并进行渲染。响应动作可以包括例如控制外围设备(例如,智能灯、智能电器等)和/或与另一系统交互以执行任务(例如,请求乘车共享、预订餐厅等)。

自动化助理通常在解释和响应于用户请求时依赖于多个离散组件的流水线。例如,自然语言理解组件可以用于处理请求的文本(例如,从口头话语转换的文本)以生成符号表示或信念状态,即该文本的语义表示。例如,信念状态可以包括与文本相对应的意图以及可选地包括用于该意图的参数(例如,时隙值)。然后,单独的实现组件可以利用信念状态来对外部知识源进行推理,这些外部知识源的结果被独立地用于动作预测任务和响应生成任务。但是,依赖于组件的流水线会使自动化助理难以扩展。而且,每个单独的组件都必须进行单独的训练,这可能在训练期间需要大量的工程工作并需要大量使用计算机资源。此外,全局增强信号(即,取决于对话轮次或完整对话的整体结果的那些)可能是有问题的和/或不可能有效地用于训练单个组件。

发明内容

本文公开的实现针对于训练和/或利用单个神经网络模型来在用户与自动化助理之间的对话会话的多个助理轮次中的每个轮次生成对应自动化助理自然语言响应和/或对应自动化助理动作。例如,在对话会话的给定助理轮次时,可以联合生成对应自然语言响应和对应动作,并且可以直接基于使用单个神经网络模型生成的输出来生成对应自然语言响应和对应动作。

对应响应和/或对应动作可以基于使用神经网络模型处理对话历史(即,用户话语、先前自动化助理响应和/或先前自动化助理动作)和多个离散资源(例如知识图条目、搜索结果和/或搜索结果文档)的而生成。例如,神经网络模型可用于在逐个令牌的基础上生成响应和/或动作,其中,每个令牌是单词、单词片段或字符。例如,在多个迭代的每个迭代,可以使用神经网络模型生成在令牌词汇表上的对应概率分布,并且在该迭代中选择具有最高概率的令牌。因此,经过多次迭代(例如,直到“结束”令牌具有最高概率为止),选择了最高概率令牌的序列,并且该序列是自然语言响应和/或动作。自然语言响应可以被渲染为自动化助理响应(例如,作为基于文本到口头话语处理的可听输出),并且任何动作都可以由自动化助理启动(例如,传输到远程设备以使得执行动作)。

以这些和其他方式,无需使用单独的自然语言组件以及随后使用单独的履行组件生成信念状态就可以生成自动化助理响应和动作。通过根据本文公开的实现训练和利用单个神经网络模型,可以跨多个域并针对各种对话执行自动化助理响应和动作生成,从而实现跨域和/或对话的自动化助理功能的有效缩放。此外,全局增强信号可以用于有效地训练单个神经网络模型,从而在训练单独的自然语言组件和/或单独的履行组件时,减轻了对信念状态的资源和劳动密集型注释的需求。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010590994.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top