[发明专利]对话模型的训练、对话生成方法、装置、设备及介质有效
申请号: | 202011413401.1 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112417127B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 汪硕芃;周晓松;张聪;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/216;G06F40/30;G06F18/2321 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 模型 训练 生成 方法 装置 设备 介质 | ||
本发明提供一种对话模型的训练、对话生成方法、装置、设备及介质,涉及数据处理技术领域。该方法包括:获取包括有多个样本问答对的目标问答数据语料,目标问答数据语料包含满足非常规且高频条件的表达语句;根据目标问答数据语料对初始对话模型进行训练,得到对话模型,其中,对话模型用于根据输入语句的句向量和目标问答数据语料确定多个初始问答对,并评估各初始问答对的相关程度、基于相关程度输出输入语句对应的输出语句。基于目标问答数据语料所训练得到的对话模型,可以基于输入语句输出不常规的输出语句,即更加灵活、趣味性更高的语句,无需人工的特殊定制,便实现对于自动的输出趣味性较高语句,减少了开发资源,提高了开发效率。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种对话模型的训练、对话生成方法、装置、设备及介质。
背景技术
随着互联网和AI(Artificial Intelligence,人工智能)技术的高速发展,在游戏、电商、社交媒体等行业和领域,人机问答技术也变得必不可少,人机问答技术可以通过机器来替代人工回复用户的问题。
相关技术中,根据输入的问题,采用训练得到的模型输出一些较为安全的回复,一般此类回复趣味性较低。为了提升一些场景下的用户体验,现有技术中可以利用文本分类将输入的问题分发到不同场景下进行回复,以实现在不同场景下回复趣味性较高的内容。
但是,相关技术中,对于每种场景、每种情况均需要进行人工的定制,开发资源过高、且效率低下。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种对话模型的训练、对话生成方法、装置、设备及介质,以便解决相关技术中,对于每种场景、每种情况均需要进行人工的定制,开发资源过高、且效率低下的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种对话模型的训练方法,所述方法包括:
获取包括有多个样本问答对的目标问答数据语料,所述目标问答数据语料包含满足非常规且高频条件的表达语句;
根据所述目标问答数据语料对初始对话模型进行训练,得到对话模型;所述对话模型用于根据输入语句的句向量和所述目标问答数据语料确定多个初始问答对,并评估各所述初始问答对的相关程度、基于所述相关程度输出所述输入语句对应的输出语句。
可选的,所述获取包括有多个样本问答对的目标问答数据语料,包括:
根据初始样本用户对话数据,确定初始问答数据语料;
基于预设训练语言模型,根据所述初始问答数据语料确定目标语句,所述目标语句为非常规且高频的语句;
根据所述目标语句从所述初始问答数据语料中筛选所述目标问答数据语料。
可选的,所述根据初始样本用户对话数据,确定初始问答数据语料,包括:
从预设领域服务数据中获取用户的对话日志文件;
对所述对话日志文件中的对话语句进行预设切割处理,获取目标问答对,所述目标问答对中问题语句和回答语句是一一对应的;
采用预设清洗规则,对所述目标问答对进行清洗处理,得到所述初始问答数据语料。
可选的,所述对所述对话日志文件中的对话语句进行预设切割处理,获取目标问答对,包括:
根据各所述对话语句的时间戳信息,对所述对话语句进行排序,得到排序后的对话语句;
对所述排序后的对话语句中,同一用户对应的多条连续对话语句进行合并,并对发送时间间隔大于预设阈值的相邻两个对话语句进行话题分割,得到处理后的对话语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011413401.1/2.html,转载请声明来源钻瓜专利网。