[发明专利]一种对话策略模型训练、对话的方法和系统有效
申请号: | 202110279376.0 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113010653B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王福东;王子豪;金春祥;李向阳;彭爽;杨明晖 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F40/211;G06K9/62;G06N3/08;G06N20/00 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 策略 模型 训练 方法 系统 | ||
本说明书实施例公开了一种对话策略模型训练、对话的方法和系统。其中,对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;使用第一训练数据对对话策略模型进行第一阶段训练,使得对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整第一模型参数,使得对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得对话策略模型的第二模型参数。
技术领域
本说明书涉及信息技术领域,特别涉及一种对话策略模型训练、对话的方法和系统。
背景技术
人与智能设备(例如,智能机器人)进行聊天对话是智能时代一种重要的互动方式。对于智能设备来说,如何响应人们的对话对整个聊天体验的影响至关重要。
通常多轮对话交互过程中,智能设备需要遵循一定的话术约束和流程约束来完成对话,目前所使用的话术和流程都是由人工制定,而人工制定的方式费时费力,效率低。
因此,有必要提出一种对话策略模型训练方法,以使得智能设备可以更好的完成对话任务。
发明内容
本说明书实施例的一个方面提供一种对话策略模型训练方法。所述对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;其中,所述第一训练数据中的第一训练样本包括样本对话上文和样本对话策略;第二训练数据中的第二训练样本至少包括样本对话上文、样本对话策略以及相应的目标奖励值;使用第一训练数据对对话策略模型进行第一阶段训练,使得所述对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得所述对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整所述第一模型参数,使得所述对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得所述对话策略模型的第二模型参数。
本说明书实施例的另一个方面提供一种对话策略模型训练系统。所述系统包括:第一确定模块,可以用于基于多轮历史对话,确定第一训练数据以及第二训练数据;其中,所述第一训练数据中的第一训练样本包括样本对话上文和样本对话策略;第二训练数据中的第二训练样本至少包括样本对话上文、样本对话策略以及相应的目标奖励值;第一训练模块,可以用于使用第一训练数据对对话策略模型进行第一阶段训练,使得所述对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得所述对话策略模型的第一模型参数;第二训练模块,可以用于使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整所述第一模型参数,使得所述对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得所述对话策略模型的第二模型参数。
本说明书实施例的另一个方面提供一种对话的方法。所述方法包括:获取对话上文;将所述对话上文输入至对话策略模型,确定用于回答所述对话上文的对话策略;中,所述对话策略模型采用如上所述的方法训练得到;基于所述对话策略确定应答话术并输出。
本说明书实施例的另一个方面提供一种对话的系统。所述系统包括:获取模块,可以用于获取对话上文;第二确定模块,可以用于将所述对话上文输入至对话策略模型,确定用于回答所述对话上文的对话策略;其中,所述对话策略模型采用如上所述的方法训练得到;第三确定模块,可以用于基于所述对话策略确定应答话术并输出。
本说明书实施例的另一个方面提供一种对话策略模型训练装置包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现对话策略模型训练方法。
本说明书实施例的另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行对话策略模型训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110279376.0/2.html,转载请声明来源钻瓜专利网。