[发明专利]一种基于Cycle-Seq2Seq的开放域对话生成方法有效

专利信息
申请号: 202010646644.3 申请日: 2020-07-07
公开(公告)号: CN111797218B 公开(公告)日: 2022-03-29
发明(设计)人: 吴嘉琪;于建港;肖定和;刘嵩 申请(专利权)人: 海南中智信信息技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06N3/02;G06N3/04;G06N3/08
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 陈欢
地址: 570100 海南省澄迈县老城高新技*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cycle seq2seq 开放 对话 生成 方法
【说明书】:

发明提供一种基于Cycle‑Seq2Seq的开放域对话生成方法,该方法包括:基于正向任务input‑to‑response和反向任务response‑to‑input建立Cycle‑Seq2Seq模型,所述正向任务input‑to‑response和反向任务response‑to‑input都使用一个NCG模型去完成对应的任务目标,正向任务input‑to‑response对应的NCG模型任务目标为根据用户的输入生成相应的回复,反向任务response‑to‑input对应的NCG模型任务目标为根据问答的回复生成可能的用户输入;对正向任务和反向任务迭代进行联合训练,共同优化联合任务的目标,每次迭代通过模型更新优化生成更准确的input‑to‑response句子和response‑to‑input句子,在联合训练过程中通过交替迭代生成质量更高的训练数据。所述方法使用较少的语料就能够训练出性能较高的模型,生成的对话内容关联性强。

技术领域

本发明涉及开放域聊天技术领域,尤其涉及一种基于Cycle-Seq2Seq的开放域对话生成方法。

背景技术

近年来,随着互联网和社交媒体的快速发展,开放域聊天机器人在生活中发挥着广泛作用。它不仅可以解决用户的交流需求,也能降低企业为用户提供服务的成本。因此,研究开放域对话生成具有一定意义,也是当下的热点研究之一。

开放域对话生成任务的主要目标是在开放域对话过程中,根据提问者的问题给出合适的回复。目前,针对该任务的主流解决方案是基于神经网络的开放域对话生成模型(Neural Conversation Generation Model,NCG),其中,现有的Seq2Seq模型取得了较好的效果,但仍然存在以下问题:

1.模型采用最大似然估计(Maximum Likelihood Estimation,MLE)生成回复,导致生成的回复常常包含大量无意义的安全回复,例如:“我不知道(I don't know)”,“对不起(Sorry)”,“没事(Nothing)”等万能答案;

2.仅使用seq2seq模型生成的回答,通常是与问题关联性弱且非常低效愚笨,容易导致对话的多样性和持续性极大程度地缺失;

3.为了尽可能满足开放域的内容覆盖需求以及对话生成的多样性,需要大量的开放域对话训练语料,导致词表过大,增加模型训练难度以及模型对话准确性等其他方面的效果。

发明内容

本发明的目的在于提供一种基于Cycle-Seq2Seq的开放域对话生成方法,通过基于多任务联合训练的完全基于数据驱动的Cycle-Seq2Seq模型来生成对话内容强关联的回复,以克服或至少部分解决现有技术所存在的上述问题。

本发明第一方面提供一种基于Cycle-Seq2Seq的开放域对话生成方法,所述方法包括:

基于正向任务input-to-response和反向任务response-to-input建立Cycle-Seq2Seq模型,所述正向任务input-to-response和反向任务response-to-input都使用一个NCG模型去完成对应的任务目标,正向任务input-to-response对应的NCG模型任务目标为根据用户的输入生成相应的回复,反向任务response-to-input对应的NCG模型任务目标为根据问答的回复生成可能的用户输入;

对正向任务和反向任务迭代进行联合训练,共同优化联合任务的目标,每次迭代通过模型更新优化生成更准确的input-to-response句子和response-to-input句子,在联合训练过程中通过交替迭代生成质量更高的训练数据。

进一步的,对正向任务和反向任务迭代进行联合训练,具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南中智信信息技术有限公司,未经海南中智信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010646644.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top