[发明专利]对话模型的训练、对话生成方法、装置、设备及介质有效

申请号：	202011413401.1	申请日：	2020-12-02
公开（公告）号：	CN112417127B	公开（公告）日：	2023-08-22
发明（设计）人：	汪硕芃;周晓松;张聪;范长杰;胡志鹏	申请（专利权）人：	网易(杭州)网络有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F40/216;G06F40/30;G06F18/2321
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	钟扬飞
地址：	310052 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	对话模型训练生成方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种对话模型的训练、对话生成方法、装置、设备及介质，涉及数据处理技术领域。该方法包括：获取包括有多个样本问答对的目标问答数据语料，目标问答数据语料包含满足非常规且高频条件的表达语句；根据目标问答数据语料对初始对话模型进行训练，得到对话模型，其中，对话模型用于根据输入语句的句向量和目标问答数据语料确定多个初始问答对，并评估各初始问答对的相关程度、基于相关程度输出输入语句对应的输出语句。基于目标问答数据语料所训练得到的对话模型，可以基于输入语句输出不常规的输出语句，即更加灵活、趣味性更高的语句，无需人工的特殊定制，便实现对于自动的输出趣味性较高语句，减少了开发资源，提高了开发效率。

技术领域

本发明涉及数据处理技术领域，具体而言，涉及一种对话模型的训练、对话生成方法、装置、设备及介质。

背景技术

随着互联网和AI(Artificial Intelligence，人工智能)技术的高速发展，在游戏、电商、社交媒体等行业和领域，人机问答技术也变得必不可少，人机问答技术可以通过机器来替代人工回复用户的问题。

相关技术中，根据输入的问题，采用训练得到的模型输出一些较为安全的回复，一般此类回复趣味性较低。为了提升一些场景下的用户体验，现有技术中可以利用文本分类将输入的问题分发到不同场景下进行回复，以实现在不同场景下回复趣味性较高的内容。

但是，相关技术中，对于每种场景、每种情况均需要进行人工的定制，开发资源过高、且效率低下。

发明内容

本发明的目的在于，针对上述现有技术中的不足，提供一种对话模型的训练、对话生成方法、装置、设备及介质，以便解决相关技术中，对于每种场景、每种情况均需要进行人工的定制，开发资源过高、且效率低下的问题。

为实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种对话模型的训练方法，所述方法包括：

获取包括有多个样本问答对的目标问答数据语料，所述目标问答数据语料包含满足非常规且高频条件的表达语句；

根据所述目标问答数据语料对初始对话模型进行训练，得到对话模型；所述对话模型用于根据输入语句的句向量和所述目标问答数据语料确定多个初始问答对，并评估各所述初始问答对的相关程度、基于所述相关程度输出所述输入语句对应的输出语句。