[发明专利]一种对话生成系统及对话实现方法有效
申请号: | 201910898543.2 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110851575B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 杨志明 | 申请(专利权)人: | 深思考人工智能科技(上海)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 牛峥;王丽琴 |
地址: | 201210 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 生成 系统 实现 方法 | ||
本发明公开了一种对话生成系统及对话实现方法,本发明实施例设置的对话生成系统采用encoder‑decoder结构的神经网络,在编码层中采用分别针对字符级及词语级的双编码层,且将经过该双编码层编码后的信息进行联合。在编码层对包含对话目标、相关知识信息及对话序列的数据集进行编码之前,分别针对字符级的编码层及针对词语级的编码层进行数据集的重构后,再输入到对话生成系统中的双编码层分别编码及联合后,再输入给解码层,由解码层使用transformer模型根据联合后的数据集信息生成相应对话回复。这样,本发明提高生成的相应对话回复的准确性及流畅性。
技术领域
本发明涉及计算机技术领域,特别涉及一种对话生成系统及对话实现方法。
背景技术
人机对话技术还处于初级阶段,整个交互流程大多是用户进行主导,机器被动回复,即机器的回复是用于响应用户的输入,无法像人一样进行自我主导的对话交互。为了使得由机器主导对话交互,设置了基于知识图谱的主动聊天任务,机器根据构建的知识图谱进行主动聊天,使得机器具备模拟人类用语言进行信息传递的能力。
在对话过程中,机器处于主动状态,引导用户从一个话题聊到另一个话题。对话系统为机器设定了一个对话目标,对话目标为“START→TOPIC_A→TOPIC_B”,表示从冷启动状态主动聊到话题A,然后进一步聊到话题B,提供的相关知识信息包括:话题A的知识信息,话题B的知识信息,话题A和话题B之间的关联信息。要求所设置的对话系统输出适用于对话序列H=u1,u2,…,ut-1的机器回复ut,使得对话自然流畅、信息丰富而且符合对话目标的规划。
为了达成上一目的,目前的对话系统采用编码层-解码层(encoder-decoder)结构的神经网络,该神经网络中,在编码层分别对对话目标、相关知识信息及对话序列进行编码;在解码层,使用注意力机制结合对话目标及对话序列中的信息尽可能得到最恰当的相应对话回复。
但是,目前的对话系统实际上采用的是基线模型结构的神经网络,其存在以下不足:
1)编码层在进行编码时相互独立,忽略了历史对话序列可以融入以使得对话序列的语义更丰富的可能性;
2)解码层在确定相应对话回复时的过程缺乏深度交互,同时显得过于单薄,可能导致推理不足或信息损失。
综上,采用目前对话系统处理对话时,存在得到的相应对话回复准确性不高及不流畅的问题。
发明内容
有鉴于此,本发明实施例提供一种对话生成系统,该系统能够在处理对话时,提高生成相应对话回复的准确性及流畅性。
本发明实施例还提供一种对话生成方法,该方法能够在处理对话时,提高生成相应对话回复的准确性及流畅性。
本发明实施例是这样实现的:
一种对话生成系统,包括:数据集预处理单元、双编码层单元及解码层单元,其中,
数据集预处理单元,用于对包含对话目标、相关知识信息及对话序列的数据集分别针对字符级的编码层及针对词语级的编码层进行重构,输出给双编码层单元;
双编码层单元,包括字符级的编码层及词语级的编码层,用于字符级的编码层对接收的经过重构的字符级的数据集进行编码,词语级的编码层对接收的经过重构的词语级的数据集进行编码后,将经过编码后的字符级的数据集和词语级的数据集联合后,输入给解码单元;
解码层单元,用于接收联合后的数据集,进行解码,得到目的、知识以及历史对话信息,生成相应回复。
所述双编码层单元,还用于所述数据集分别针对字符级的编码层及针对词语级的编码层进行重构为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能科技(上海)有限公司,未经深思考人工智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910898543.2/2.html,转载请声明来源钻瓜专利网。