[发明专利]基于关键词生成回复语句的方法及装置有效
申请号: | 201811012193.7 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109241262B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 姚丽丽 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关键词 生成 回复 语句 方法 装置 | ||
本发明实施例公开了一种基于关键词生成回复语句的方法及装置,涉及自然语言处理技术领域,提高了人机对话系统生成回复语句的内容丰富度。本发明实施例主要技术方案为:获取用户输入的提问语句,并生成所述提问语句对应的多个词向量;使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量;确定所述提问语句对应的关键词的词向量;使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句。本发明实施例主要应用于人机对话系统生成回复语句。
技术领域
本发明实施例涉及自然语言处理技术领域,尤其涉及一种基于关键词生成回复语句的方法及装置。
背景技术
随着人工智能技术的不断发展,基于Seq2Seq(Sequence to Sequence,序列到序列)模型开发的人机对话系统逐渐受到人们的关注。其中,Seq2Seq模型由编码器和解码器组成,当人机对话系统接收到终端用户输入的提问语句后,人机对话系统首先使用编码器将提问语句编码为一个状态向量,然后使用解码器对该状态向量进行解码处理,从而生成回复语句。
发明人在实现本发明的过程中,发现现有技术中存在以下技术问题,由于,在对Seq2Seq模型进行训练时,通常采用最大似然法进行训练,因此,会导致出现频率较高的回复语句更容易被生成的情况发生,从而使得人机对话系统很大概率会生成“不知道”、“好的”等无实质意义的通用回复语句,进而导致人机对话无法再进行下去,使得终端用户的用户体验较差。
发明内容
有鉴于此,本发明实施例提供一种基于关键词生成回复语句的方法及装置,主要目的在于提高人机对话系统生成回复语句的内容丰富度。
为了达到上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种基于关键词生成回复语句的方法,该方法包括:
获取用户输入的提问语句,并生成所述提问语句对应的多个词向量;
使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量;
确定所述提问语句对应的关键词的词向量;
使用解码器对所述关键词的词向量以及所述隐藏层状态向量进行解码处理,以生成所述提问语句对应的回复语句。
可选的,所述编码器包含第一LSTM隐藏层和第二LSTM隐藏层;所述第一LSTM隐藏层包含多个第一LSTM神经单元,所述第二LSTM隐藏层包含多个第二LSTM神经单元;所述使用编码器对多个所述词向量进行编码处理,以生成所述提问语句对应的隐藏层状态向量,包括:
根据所述提问语句对多个所述词向量进行排序;
将排序后的多个所述词向量依次输入所述编码器,以便所述编码器确定每个所述词向量对应的第一LSTM神经单元以及第二LSTM神经单元;
通过所述第一LSTM神经单元将其对应的词向量以及前一第一LSTM神经单元的第一隐藏层状态向量代入第一非线性激活函数,以计算所述第一LSTM神经单元对应的第一隐藏层状态向量,其中,排序后的多个所述词向量中的第一个词向量对应的第一LSTM神经单元的前一第一LSTM神经单元的第一隐藏层状态向量的取值为空向量;
通过所述第二LSTM神经单元将其对应的第一LSTM神经单元的第一隐藏层状态向量、前一第二LSTM神经单元的第二隐藏层状态向量以及空向量代入第二非线性激活函数,以计算所述第二LSTM神经单元对应的第二隐藏层状态向量,其中,排序后的多个所述词向量中的第一个词向量对应的第二LSTM神经单元的前一第二LSTM神经单元的第二隐藏层状态向量的取值为空向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811012193.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种帕金森对话式问诊系统
- 下一篇:一种大数据统计分析系统及其工作流程