[发明专利]对话模型的训练、对话生成方法、装置、设备及介质有效
申请号: | 202011413401.1 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112417127B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 汪硕芃;周晓松;张聪;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/216;G06F40/30;G06F18/2321 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 模型 训练 生成 方法 装置 设备 介质 | ||
1.一种对话模型的训练方法,其特征在于,所述方法包括:
获取包括有多个样本问答对的目标问答数据语料,所述目标问答数据语料包含满足非常规且高频条件的表达语句;
根据所述目标问答数据语料对初始对话模型进行训练,得到对话模型;所述对话模型用于根据输入语句的句向量和所述目标问答数据语料确定多个初始问答对,并评估各所述初始问答对的相关程度、基于所述相关程度输出所述输入语句对应的输出语句;
所述对话模型包括:第一匹配模型和第二匹配模型,所述第二匹配模型为孪生网络;所述根据所述目标问答数据语料分别对初始相关性匹配模型进行训练,得到对话模型,包括:
对所述目标问答数据语料进行采样处理,得到正样本和负样本;
将所述正样本和所述负样本中的问答语句进行拼接,获取拼接后的样本;
根据所述拼接后的样本对初始第一匹配模型进行训练,直至所述初始第一匹配模型中损失函数收敛,得到所述第一匹配模型;
根据所述正样本、所述负样本和预设问答隐层向量计算余弦相似度,对初始孪生网络进行拟合训练,直至所述初始孪生网络中损失函数收敛,得到所述第二匹配模型。
2.根据权利要求1所述的方法,其特征在于,所述获取包括有多个样本问答对的目标问答数据语料,包括:
根据初始样本用户对话数据,确定初始问答数据语料;
基于预设训练语言模型,根据所述初始问答数据语料确定目标语句,所述目标语句为非常规且高频的语句;
根据所述目标语句从所述初始问答数据语料中筛选所述目标问答数据语料。
3.根据权利要求2所述的方法,其特征在于,所述根据初始样本用户对话数据,确定初始问答数据语料,包括:
从预设领域服务数据中获取用户的对话日志文件;
对所述对话日志文件中的对话语句进行预设切割处理,获取目标问答对,所述目标问答对中问题语句和回答语句是一一对应的;
采用预设清洗规则,对所述目标问答对进行清洗处理,得到所述初始问答数据语料。
4.根据权利要求3所述的方法,其特征在于,所述对所述对话日志文件中的对话语句进行预设切割处理,获取目标问答对,包括:
根据各所述对话语句的时间戳信息,对所述对话语句进行排序,得到排序后的对话语句;
对所述排序后的对话语句中,同一用户对应的多条连续对话语句进行合并,并对发送时间间隔大于预设阈值的相邻两个对话语句进行话题分割,得到处理后的对话语句;
将所述处理后的对话语句中为预设安全字符、且字符数量小于预设数量的语句进行过滤,得到所述目标问答对。
5.根据权利要求3所述的方法,其特征在于,所述采用预设清洗规则,对所述目标问答对进行清洗处理,得到所述初始问答数据语料,包括:
删除所述目标问答对料中由非中文字符组成的语句、各语句中的首部和尾部的非中文字符;和/或,采用预设情感分析模型对所述目标问答对中包括有敏感词的问答对进行过滤,得到所述初始问答数据语料。
6.根据权利要求2所述的方法,其特征在于,所述基于预设训练语言模型,根据所述初始问答数据语料确定目标语句,包括:
采用所述预设训练语言模型计算所述初始问答数据语料中各语句的困惑度,所述困惑度用于表征语句的常规程度;
根据所述困惑度对所述初始问答数据语料中各语句进行排序,得到排序后的初始问答数据语料;
对所述排序后的初始问答数据语料进行聚类分析,得到多个簇,每个所述簇包括至少一个语句;
对各所述簇中的语句进行筛选,得到所述目标语句。
7.根据权利要求6所述的方法,其特征在于,所述对各所述簇中的语句进行筛选,得到所述目标语句,包括:
若所述簇中语句数量大于预设语句数量,则将所述簇中语句的各个子语句在所述初始问答数据语料中出现次数大于预设次数的语句,作为所述目标语句;或者,
若所述簇中包括一个语句,且所述语句的子语句在所述初始问答数据语料中出现次数大于所述预设次数,则将所述语句作为所述目标语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011413401.1/1.html,转载请声明来源钻瓜专利网。