[发明专利]多轮对话的处理方法及处理装置、车辆、存储介质有效
申请号: | 202010009323.2 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111209383B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 申众;于淼 | 申请(专利权)人: | 广州小鹏汽车科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 邵泳城 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轮对 处理 方法 装置 车辆 存储 介质 | ||
本发明公开了一种多轮对话的处理方法及处理装置、车辆、存储介质。多轮对话的处理方法,包括:基于多任务联合训练模型提取查询文本的多个特征,多任务联合训练模型包括基于预训练模型进行多任务联合微调训练获得的模型;对多个特征进行映射以获取特征结构;将特征结构作为对话状态模型的输入以预测回复文本。本发明实施方式的多轮对话的处理方法,采用多任务联合训练模型提取查询文本的多个特征,然后进行特征映射并预测回复文本。由于只采用多任务联合训练模型对查询文本进行预测,减少了使用资源,架构相对简单且方便扩展。
技术领域
本发明涉及数据处理技术领域,特别涉及一种多轮对话的处理方法及处理装置、车辆、存储介质。
背景技术
智能汽车的人机交互过程中,车载显示屏和语音是两个主要的交互通道,通过语音和中控显示屏进行多轮问答交互也成为车载场景中获取信息的重要方式。在多轮对话状态跟踪中,需要不同维度的特征来对用户的回复进行预测。在相关技术中,认为意图识别、槽位预测或提取是不同独立的任务,因而采用多个模型来分别预测。然而,在真实场景中,需要考虑多模型预测带来架构的复杂性及耗时更高的问题。
发明内容
本发明实施方式提供一种多轮对话的处理方法及处理装置、车辆、存储介质。
本发明实施方式的多轮对话的处理方法,包括:
基于多任务联合训练模型提取查询文本的多个特征,所述多任务联合训练模型包括基于预训练模型进行多任务联合微调训练获得的模型;
对所述多个特征进行映射以获取特征结构;
将所述特征结构作为对话状态模型的输入以预测回复文本。
本发明实施方式的多轮对话的处理方法中,采用多任务联合训练模型提取查询文本的多个特征,然后进行特征映射并预测回复文本。由于只采用多任务联合训练模型对查询文本进行预测,减少了使用资源,架构相对简单且方便扩展。
在某些实施方式中,基于多任务联合训练模型提取查询文本的多个特征,包括:
基于所述预训练模型对所述查询文本进行多任务联合微调训练以使每个任务的损失函数收敛;
在所述每个任务的损失收敛的情况下,对所述查询文本提取所述多个特征。
在某些实施方式中,基于所述预训练模型对所述查询文本进行多任务联合微调训练以使每个任务的损失函数收敛,包括:
基于所述预训练模型对所述查询文本进行处理以使所述预训练模型输出隐含层向量;
采用所述隐含层向量作为所述多任务的每个任务的输入;
根据所述输入分别确定所述每个任务的损失及所述损失的权重;
根据所述损失的权重交替训练所述每个任务以使对应的损失函数收敛。
在某些实施方式中,根据所述损失的权重交替训练所述每个任务以使对应的损失函数收敛,包括:
确定所述多任务在每个训练周期的一个目标任务;
遮掩除所述目标任务的其他任务的损失,并训练所述目标任务;
交替训练直至完成所述每个任务对应的损失函数收敛。
在某些实施方式中,确定所述多任务在每个训练周期的一个目标任务,包括:
根据所述每个任务对应的损失的权重确定所述目标任务。
在某些实施方式中,所述多个特征包括领域、意图、实体和/或槽位,所述多任务包括领域分类任务、意图分类任务、实体和/或槽位识别任务。
在某些实施方式中,所述特征结构与所述对话状态模型的类型相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司,未经广州小鹏汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010009323.2/2.html,转载请声明来源钻瓜专利网。