[发明专利]对话生成模型训练方法、对话生成方法及装置在审
申请号: | 202010117297.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111339274A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 张荣升;邵建智;毛晓曦;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 王文红 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 生成 模型 训练 方法 装置 | ||
本公开提供一种对话生成模型训练方法、对话生成方法及装置,包括:获取多组样本数据,每组样本数据中,包括真实问题、与真实问题匹配的真实答案,以及与真实答案对应的至少一个相似答案;根据每组样本数据中的真实问题和相似答案进行编码,得到与每组样本数据中的真实问题和相似答案分别对应的编码数据;根据每组样本数据中的真实问题和相似答案分别对应的编码数据、以及真实答案,得到每组样本数据对应的预测对话;基于各组样本数据分别对应的预测对话以及真实答案进行训练以生成对话生成模型。该实施例中相似答案为答案生成模型增加了更多可用的背景信息,使得对话生成模型可以生成更多有信息性的回复,且生成的对话具有多样性。
技术领域
本公开涉及深度学习技术领域,具体而言,涉及一种对话生成模型训练方法、对话生成方法及装置。
背景技术
对话系统是深度学习应用的一个重要方向,目前基于深度学习的对话系统按照实现方式可以分为两种类型,一种是生成式对话系统,生成式系统接受用户输入的文字,并基于用户输入的文字,以及预先训练的模型生成一条回复。另一种是检索式对话系统,检索式的对话系统一般分为候选问答对召回和匹配打分排序两个步骤。候选问答对召回是根据用户输入的句子,检索出语料库中相似的问题,并取出其对应的回复作为候选集。然后再利用训练好的匹配模型对用户输入和候选集中的候选回复进行打分,作为两者的匹配度,然后取出分数最高的候选回复作为最终回复返回给用户。
生成式对话系统生成的在很多情况下缺乏具体信息,检索式对话生成系统所生成的对话虽然不会缺乏具体信息,但生成的对话缺乏多样性。
发明内容
本公开实施例至少提供一种对话生成模型训练方法、对话生成方法及装置。
第一方面,本公开实施例提供了一种对话生成模型训练方法,包括:获取多组样本数据,每组样本数据中,包括真实问题、与所述真实问题匹配的真实答案,以及与所述真实答案对应的至少一个相似答案;根据每组所述组样本数据中的真实问题和相似答案进行编码,得到与所述每组样本数据中的真实问题和相似答案分别对应的编码数据;根据所述每组样本数据中的所述真实问题和所述相似答案分别对应的编码数据、以及所述真实答案,得到所述每组样本数据对应的预测对话;基于各组所述样本数据分别对应的预测对话以及真实答案进行训练以生成所述对话生成模型。
一种可选的实施方式中,获取一组所述样本数据,包括:所述获取多组样本数据,包括:获取多组样本数据中每组样本数据的真实问题,以及与所述每组样本数据的真实问题匹配的真实答案;基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案;其中,所述训练语料库中包括多个训练语料对,每个训练语料对中包括一个真实问题,以及与该真实问题对应的真实答案。
一种可选的实施方式中,所述基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,包括:将所述每组样本数据的真实问题匹配的真实答案,与所述训练语料库中各个训练语料对中的真实答案依次进行第一字符匹配,并基于所述第一字符匹配的结果,确定所述与所述每组样本数据的真实问题匹配的真实答案,与各个训练语料对中的真实答案分别对应的第一相似度;基于所述第一相似度,从各个训练语料对中的真实答案中,确定与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
一种可选的实施方式中,所述基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案,包括:基于所述每组样本数据的真实问题以及匹配的真实答案,在所述训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010117297.5/2.html,转载请声明来源钻瓜专利网。