[发明专利]对话生成模型训练方法、对话生成方法及装置在审
申请号: | 202010117297.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111339274A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 张荣升;邵建智;毛晓曦;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 王文红 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 生成 模型 训练 方法 装置 | ||
1.一种对话生成模型训练方法,其特征在于,包括:
获取多组样本数据,每组样本数据中,包括真实问题、与所述真实问题匹配的真实答案,以及与所述真实答案对应的至少一个相似答案;
根据每组所述组样本数据中的真实问题和相似答案进行编码,得到与所述每组样本数据中的真实问题和相似答案分别对应的编码数据;
根据所述每组样本数据中的所述真实问题和所述相似答案分别对应的编码数据、以及所述真实答案,得到所述每组样本数据对应的预测对话;
基于各组所述样本数据分别对应的预测对话以及真实答案进行训练以生成所述对话生成模型。
2.根据权利要求1所述的对话生成模型训练方法,其特征在于,所述获取多组样本数据,包括:
获取多组样本数据中每组样本数据的真实问题,以及与所述每组样本数据的真实问题匹配的真实答案;
基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案;
其中,所述训练语料库中包括多个训练语料对,每个训练语料对中包括一个真实问题,以及与该真实问题对应的真实答案。
3.根据权利要求2所述的对话生成模型训练方法,其特征在于,所述基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,包括:
将所述每组样本数据的真实问题匹配的真实答案,与所述训练语料库中各个训练语料对中的真实答案依次进行第一字符匹配,并基于所述第一字符匹配的结果,确定所述与所述每组样本数据的真实问题匹配的真实答案,与各个训练语料对中的真实答案分别对应的第一相似度;
基于所述第一相似度,从各个训练语料对中的真实答案中,确定与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
4.根据权利要求2所述的对话生成模型训练方法,其特征在于,所述基于与所述每组样本数据的真实问题匹配的真实答案,在训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案,包括:
基于所述每组样本数据的真实问题以及匹配的真实答案,在所述训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
5.根据权利要求4所述的对话生成模型训练方法,其特征在于,所述基于所述每组样本数据的真实问题以及匹配的真实答案,在所述训练语料库中进行相似检索,得到与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案,包括:
将所述每组样本数据的真实问题以及匹配的真实答案作为目标对话对,与所述训练语料库中各个样本语料对依次进行第二字符匹配,并基于所述第二字符匹配的结果,确定所述训练语料库中的各个训练语料对分别与所述目标对话对的第二相似度;
基于所述第二相似度,从各个训练语料对中确定多个目标语料对,并基于所述目标语料对中的真实答案,确定与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
6.根据权利要求5所述的对话生成模型训练方法,其特征在于,所述基于所述目标语料对中的真实答案,确定与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案,包括:
确定所述每组样本数据的真实问题、与各个所述目标语料对中的真实答案之间的匹配度;
基于所述匹配度,从各个所述目标语料对中的真实答案中,确定与所述每组样本数据的真实问题匹配的真实答案对应的至少一个相似答案。
7.根据权利要求6所述的对话生成模型训练方法,其特征在于,所述确定所述每组样本数据的真实问题与各个所述目标语料对中的真实答案之间的匹配度,包括:
将所述每组样本数据的真实问题,与各个所述目标语料对中的真实答案构成备选对话对;
基于预先训练的对话匹配模型,得到各个所述备选对话对对应的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010117297.5/1.html,转载请声明来源钻瓜专利网。