[发明专利]一种基于对话框状态跟踪模型的任务外训练系统在审
申请号: | 202110104849.3 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112818097A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 潘晓光;焦璐璐;令狐彬;宋晓晨;韩丹 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62 |
代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
地址: | 030006 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对话框 状态 跟踪 模型 任务 训练 系统 | ||
1.一种基于对话框状态跟踪模型的任务外训练系统,其特征在于:包括DST模块、辅助任务模块、ITFT模块和MTL模块,所述ITFT模块连接有MTL模块,所述MTL模块连接有DST模块,所述MTL模块连接有辅助任务模块;
所述DST模块用于从用户输入中提取意义和意图,并在对话的继续过程中保留和更新这些信息;
所述辅助任务模块用于支持模型训练;
所述ITFT模块用于将编码器的参数引导到一个有利的方向,以便后续的微调能找到更好的局部最优;
所述MTL模块用于在辅助任务和目标任务之间同时训练相同的模型。
2.根据权利要求1所述的一种基于对话框状态跟踪模型的任务外训练系统,其特征在于:所述DST模块中,DST即对话状态跟踪,使用DST模型Trippy处理数据集,通过Roberta编译器给予bert对片段的区分在对话中的适应性。
3.根据权利要求1所述的一种基于对话框状态跟踪模型的任务外训练系统,其特征在于:所述辅助任务模块中,包括句子和句子对层面的分类任务,所述辅助任务模块采用以下训练约束:辅助任务为分类问题或跨度预测问题;一次只能使用一个辅助任务。
4.根据权利要求1所述的一种基于对话框状态跟踪模型的任务外训练系统,其特征在于:所述ITFT模块为任务微调模块,在两个不相关的任务上连续训练相同的模型,所述两个不相关的任务分别为辅助任务和DST任务。
5.根据权利要求1所述的一种基于对话框状态跟踪模型的任务外训练系统,其特征在于:所述MTL模块为多任务学习模块,对每一步进行DST训练,而且对辅助任务进行额外的训练,在步骤的层次上,训练在辅助任务和目标任务之间交替进行,所述辅助任务和目标任务同享一个优化器,并连续执行连两个更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110104849.3/1.html,转载请声明来源钻瓜专利网。