[发明专利]对话预训练模型的训练方法及相关装置在审
申请号: | 202211737729.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116108918A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 曾钢欣 | 申请(专利权)人: | 深圳数联天下智能科技有限公司 |
主分类号: | G06N3/096 | 分类号: | G06N3/096;G06F40/35 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 唐梦云 |
地址: | 518000 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 训练 模型 方法 相关 装置 | ||
本申请实施例涉及智能对话技术领域,公开了一种对话预训练模型的训练方法及相关装置,采用若干个第一领域的第一对话历史对神经网络进行训练,得到第一对话预训练模型,其中,第一对话历史标注有第一真实标签,第一真实标签包括至少一个对话任务,对话任务反映第一对话历史的语义逻辑。然后,采用多个第二领域的第二对话历史对第一对话预训练模型进行训练,得到第二对话预训练模型。其中,第二对话历史标注有第二真实标签,第二真实标签与第一真实标签具有相同的结构,第二对话历史的数量小于第一对话历史的数量。通过迁移学习,其他第二领域只需要少量的标注数据也可训练得到效果较好的第二对话预训练模型,能够大幅降低标注成本。
技术领域
本申请实施例涉及智能对话技术领域,尤其涉及一种对话预训练模型的训练方法及相关装置。
背景技术
对话系统一般可以分成三个大类:任务型对话系统、闲聊型对话系统、问答型对话系统,本发明主要的研究对象是任务型对话系统。任务型对话通常情况下是为了满足带有明确目的的用户,例如查天气、打电话、订票、订餐等等。由于用户的需求较为复杂,通常情况下需分多轮互动,用户也可能在对话过程中不断修改与完善自己的需求,任务型机器人需要通过询问、澄清和确认来帮助用户明确目的。
流水线式的TOD(task-oriented dialogue,面向任务对话)系统由四个模块组成:NLU(Natural Language Understanding,自然语言理解)、DST(Dialog StateTracking,对话状态跟踪)、DP(dialogue policy对话策略)和NLG(natural languagegeneration,自然语言生成)。
该四个模块是流水线式工作的,不同的模块分别基于对话预训练模型独立训练。其中,对话预训练模型是通过开放领域的海量对话数据以自监督的方式训练得到的预训练语言模型。也即,每个领域的对话训练模型都严重依赖于大量的标注数据进行训练。
发明内容
本申请实施例主要解决的技术问题是提供一种对话预训练模型的训练方法及相关装置,能够在大幅降低标注成本的情况下,训练得到效果较好的对话预训练模型。
第一方面,本申请实施例中提供了一种对话预训练模型的训练方法,包括:
采用若干个第一领域的第一对话历史对神经网络进行训练,得到第一对话预训练模型,其中,第一对话历史标注有第一真实标签,第一真实标签包括至少一个对话任务,对话任务反映第一对话历史的语义逻辑;
采用多个第二领域的第二对话历史对第一对话预训练模型进行训练,得到第二对话预训练模型;第二对话历史标注有第二真实标签,第二真实标签与第一真实标签具有相同的结构,第二对话历史的数量小于第一对话历史的数量。
在一些实施例中,前述采用若干个第一领域的第一对话历史对神经网络进行与训练,得到第一对话预训练模型,包括:
将第一对话历史格式化,得到第一格式化序列;
将第一格式化序列,输入神经网络,神经网络基于第一数据库输出第一预测标签,其中,第一数据库是第一领域的问答数据库;
根据若干个第一预测标签和若干个第一真实标签之间的差异,调整神经网络的模型参数,直至极大似然函数最大化,得到第一对话预训练模型。
在一些实施例中,前述将第一对话历史格式化,得到第一格式化序列,包括:
将第一对话历史和各个对话任务进行拼合处理,前述第一对话历史和各个对话任务中的任意两者之间插入有标识符以进行区分,得到第一格式化序列。
在一些实施例中,前述第一真实标签包括真实对话状态,真实对话状态反映第一对话历史的话题特征;
极大似然函数包括第一极大似然函数,第一极大似然函数反映第一预测标签中的预测对话状态是真实对话状态的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳数联天下智能科技有限公司,未经深圳数联天下智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211737729.8/2.html,转载请声明来源钻瓜专利网。