[发明专利]用于问答匹配的神经网络模型的训练方法和装置有效

申请号：	201910507153.8	申请日：	2019-06-12
公开（公告）号：	CN110427466B	公开（公告）日：	2023-05-26
发明（设计）人：	马良庄	申请（专利权）人：	创新先进技术有限公司
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/0455;G06N3/047;G06F16/332;G06F16/35
代理公司：	北京亿腾知识产权代理事务所(普通合伙) 11309	代理人：	孙欣欣;周良玉
地址：	开曼群岛大开曼岛***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于问答匹配神经网络模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书实施例提供一种用于问答匹配的神经网络模型的训练方法和装置，方法包括：获取样本集合中的各用户问句以及各用户问句对应的分类标签；利用已训练的第一神经网络模型，预测各用户问句在各分类上的第一概率得分；利用待训练的第二神经网络模型，预测各用户问句在各分类上的第二概率得分，第二神经网络模型的层数小于第一神经网络模型的层数；根据第二概率得分和第一概率得分，得到第一损失函数；根据第二概率得分和各用户问句的分类标签，得到第二损失函数；将第一损失函数与第二损失函数组合为总损失函数；根据总损失函数，训练第二神经网络模型，能够在准确识别用户问句的基础上，降低资源消耗，提升处理速度。

技术领域

本说明书一个或多个实施例涉及计算机领域，尤其涉及用于问答匹配的神经网络模型的训练方法和装置。

背景技术

自然语言处理(natural language processing，NLP)，是一门研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法的科学。在NLP中，一个典型的应用就是针对用户问句的问答匹配，以实现由客服机器人根据问答匹配的结果回答用户问题。

在客服机器人系统中，出于准确识别用户问句的目的，通常地，用于问答匹配的神经网络模型结构复杂，非常消耗计算资源，处理速度慢，导致出现服务超时的情况。

因此，希望能有改进的方案，能够在准确识别用户问句的基础上，降低资源消耗，提升处理速度。

发明内容

本说明书一个或多个实施例描述了一种用于问答匹配的神经网络模型的训练方法和装置，能够在准确识别用户问句的基础上，降低资源消耗，提升处理速度。

第一方面，提供了一种用于问答匹配的神经网络模型的训练方法，方法包括：

获取样本集合中的各个用户问句以及各个用户问句对应的分类标签；

利用已训练的第一神经网络模型，预测各个用户问句在各个分类上的第一概率得分，其中所述第一神经网络模型的层数为N；

利用待训练的第二神经网络模型，预测各个用户问句在各个分类上的第二概率得分，其中，所述第二神经网络模型的层数为M，MN；