[发明专利]一种意图理解模型训练方法及装置、意图理解方法及装置在审
申请号: | 202011500085.1 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112528679A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 尹坤;刘权;陈志刚;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35;G06F40/42;G06F3/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 冯柳伟 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 理解 模型 训练 方法 装置 | ||
本申请公开了一种意图理解模型训练方法及装置、意图理解方法及装置,该意图理解模型训练方法包括:在获取到目标语言训练数据和辅助语言训练数据之后,先将该目标语言训练数据和该辅助语言训练数据输入意图理解模型,得到该意图理解模型输出的该目标语言训练数据对应的预测意图和该辅助语言训练数据对应的预测意图,并根据该目标语言训练数据对应的预测意图和该辅助语言训练数据对应的预测意图,确定该意图理解模型的模型预测损失;再根据该模型预测损失更新意图理解模型,并返回执行将目标语言训练数据和辅助语言训练数据输入意图理解模型的步骤及其后续步骤,直至达到预设停止条件。如此能够有效地提高意图理解模型的意图理解性能。
技术领域
本申请涉及计算机技术领域,尤其涉及一种意图理解模型训练方法及装置、意图理解方法及装置。
背景技术
目前,一些人机交互设备能够针对用户输入的用户语句(例如,语音语句和/或文本语句)与该用户进行人机交互,以使得该人机交互设备能够辅助该用户完成相应的操作需求(例如,路线查询、机票订购等需求)。
对于人机交互设备来说,在人机交互设备接收到用户输入的用户语句之后,该人机交互设备需要先针对该用户语句进行意图理解确定用户意图,再由该人机交互设备依据该用户意图与该用户进行人机交互。
然而,因现有的人机交互设备仍然无法对用户语句(尤其是地方方言、小语种等使用范围较小语言下的用户语句)进行准确地意图理解,导致如何准确地理解用户意图是一个亟待解决的技术问题。
发明内容
本申请实施例的主要目的在于提供一种意图理解模型训练方法及装置、意图理解方法及装置,能够从用户语句中准确地理解出用户意图,尤其能够从地方方言、小语种等使用范围较小语言下用户语句中准确地理解出用户意图。
本申请实施例提供了一种意图理解模型训练方法,所述方法包括:
获取目标语言训练数据和辅助语言训练数据;
将所述目标语言训练数据和所述辅助语言训练数据输入意图理解模型,得到所述意图理解模型输出的所述目标语言训练数据对应的预测意图和所述辅助语言训练数据对应的预测意图;
根据所述目标语言训练数据对应的预测意图和所述辅助语言训练数据对应的预测意图,确定所述意图理解模型的模型预测损失;
根据所述意图理解模型的模型预测损失更新所述意图理解模型,并继续执行所述将所述目标语言训练数据和所述辅助语言训练数据输入意图理解模型的步骤,直至达到预设停止条件。
在一种可能的实施方式中,所述目标语言训练数据包括目标语言真实数据、目标语言翻译数据和目标语言生成数据中的至少一种;其中,所述目标语言翻译数据是将辅助语言真实数据进行翻译得到的;所述目标语言生成数据是根据候选意图数据生成的。
在一种可能的实施方式中,所述目标语言生成数据的获取过程为:
将所述候选意图数据输入预先构建的目标语言数据生成模型,得到所述目标语言数据生成模型输出的目标语言生成数据;其中,所述目标语言数据生成模型是利用目标语言标注数据和辅助语言标注数据训练得到的。
在一种可能的实施方式中,所述目标语言数据生成模型的构建过程包括:
利用所述辅助语言标注数据对待训练模型进行训练,得到辅助语言数据生成模型;
利用所述目标语言标注数据对所述辅助语言数据生成模型进行训练,得到所述目标语言数据生成模型。
在一种可能的实施方式中,所述目标语言翻译数据的获取过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011500085.1/2.html,转载请声明来源钻瓜专利网。