[发明专利]语句处理方法、装置和系统在审
申请号: | 201810851351.1 | 申请日: | 2018-07-27 |
公开(公告)号: | CN110851574A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 任昭春;雷文强;金熙森;陈宏申;殷大伟;赵一鸿 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/211;G06F40/289 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 处理 方法 装置 系统 | ||
本公开提供了一种语句处理方法,包括:获取待处理向量,该待处理向量包括输入语句的向量表示;将待处理向量输入至第一循环神经网络,生成一个或多个关键词;确定与一个或多个关键词对应的答复内容;以及基于一个或多个关键词及答复内容,生成输入语句的答复语句。本公开还提供了一种语句处理装置和系统。
技术领域
本公开涉及电子技术领域,更具体地,涉及一种语句处理方法、装置和系统。
背景技术
随着电子技术的发展,人机对话成为语音识别和自然语言处理领域中的一个重要的研究和应用热点,而随着人机对话系统的发展和产业应用逐步深入,任务驱动型的多轮对话系统得到了产业界的更多关注,也对相关研发提出了更多的挑战。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:现有的任务驱动型的对话系统主要有模块型和端到端型,其中模块型对话系统存在以下局限:用户的反馈难以传给模型,以及各模块间相互依赖,适应新环境时需要很多人力来进行修改;端到端型对话系统需要监督学习大量数据,且需要依赖置信追踪器(belief tracker)使用在上轮对话中出现的语句作为中间状态块(slot)的值,从而需要消耗很多的参数复杂度。
发明内容
有鉴于此,本公开提供了一种能够减少对话系统复杂度的语句处理方法、装置和系统。
本公开的一个方面提供了一种语句处理方法,包括:获取待处理向量,该待处理向量包括输入语句的向量表示;将待处理向量输入至第一循环神经网络,生成一个或多个关键词;确定与一个或多个关键词对应的答复内容;以及基于所述一个或多个关键词及答复内容,生成输入语句的答复语句。
根据本公开的实施例,获取待处理向量包括:获取当前的输入语句,前一次生成的答复语句及前一次生成的一个或多个关键词;将当前的输入语句,前一次生成的答复语句及前一次生成的一个或多个关键词中的词转化为词向量;以及将词向量有序输入至第二循环神经网络,获取第二循环神经网络的隐藏层状态的向量表示以作为待处理向量,其中,在不存在前一次生成的答复语句的情况下,前一次生成的答复语句及前一次生成的一个或多个关键词为默认值。
根据本公开的实施例,将待处理向量输入至第一循环神经网络,生成一个或多个关键词包括循环执行的以下操作,直至生成完整的一个或多个关键词:以第一循环神经网络的输入更新第一循环神经网络的隐藏层状态,得到当前的多个候选关键词;以及根据当前的多个候选关键词的输出概率,确定当前的关键词,每个候选关键词的输出概率包括:该候选关键词由第一循环神经网络生成的概率与该候选关键词自所述输入语句复制得到的概率之和,其中,在上述循环中,以待处理向量作为第一循环神经网络的初始输入,以前一次循环中得到的关键词的向量表示与隐藏层状态的向量表示作为后一次循环中第一循环神经网络的输入。
根据本公开的实施例,基于一个或多个关键词及答复内容,生成输入语句的答复语句包括:将一个或多个关键词的向量表示、第一循环神经网络的隐藏层状态的向量表示及答复类型的向量表示输入第三循环神经网络,生成一个或多个答复词;以及根据一个或多个答复词及候选答复值,生成所述输入语句的答复语句,其中,答复内容包括答复类型的向量表示及候选答复值,答复类型的向量表示与候选答复值的数量相关。
根据本公开的实施例,生成一个或多个答复词包括循环执行的以下操作,直至生成完整的一个或多个答复词:以第三循环神经网络的输入更新第三循环神经网络的隐藏层状态,得到当前的多个候选答复词;以及根据当前的多个候选答复词的输出概率,确定当前的答复词,每个候选答复词的输出概率包括:该候选答复词由第三循环神经网络生成的概率与该候选答复词自输入语句复制得到的概率之和,其中,在上述循环中,以一个或多个关键词的向量表示、第一循环神经网络最终的隐藏层状态的向量表示及答复类型的向量表示作为第三循环神经网络的初始输入,以前一次循环中得到的答复词的向量表示与隐藏层状态的向量表示作为后一次循环中第三循环神经网络的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810851351.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语句处理方法、系统和电子设备
- 下一篇:用于搜索的方法、系统和服务器集群