[发明专利]基于机器学习的问题答复方法、问答模型训练方法及装置有效
申请号: | 201910816075.X | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516059B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N20/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 问题 答复 方法 问答 模型 训练 装置 | ||
本申请公开了一种基于机器学习的问题答复方法、问答模型训练方法及装置,涉及人工智能领域。上述训练方法包括:通过获取训练样本,每组训练样本包括问题样本、答案样本和标定位置,答案样本是由正确答案样本和错误答案样本拼接在一起形成的答案文档;通过问答模型对问题样本与答案样本进行编码,得到样本的向量序列;通过问答模型预测正确答案样本在样本的向量序列中的位置,并确定正确答案样本的位置与标定位置之间的损失;根据损失对问答模型中的模型参数进行调整,训练问答模型对正确答案样本的位置预测能力。该方法采用拼接在一起的答案样本对问答模型进行训练,训练问答模型的阅读理解能力,使问答模型能够在多个答案中准确的找到正确答案。
技术领域
本申请涉及人工智能领域,特别涉及一种基于机器学习的问题答复方法、问答模型训练方法及装置。
背景技术
在车载语音系统、智能音箱、智能客服、儿童陪伴机器人等产品中,通常采用经典的问答模型实现问答功能,其中,上述问答模型是由构建的问答知识库对神经网络模型训练得到的。当上述产品采集得到用户询问的问题时,问答模型能够给出问答知识库中最匹配的答案。
相关技术提供的问答模型训练方法,是将问答对作为输入,输出二分类标签,通过二分类标签表明该问答对是正样本或者负样本。比如,将一个问答对Q,A作为输入,对神经网络模型进行训练,得到问答对Q,A的二分类标签为正样本,表示问答对中问题Q的正确答案为A;又比如,将一个问答对Q,B作为输入,对神经网络模型进行训练,得到问答对Q,B的二分类标签为负样本,表示问答对中问题Q的错误答案为B。
显然的,在上述问答模型训练方法中,正负样本是割裂开的,二者之间没有建立关联,因此,上述训练方法训练得到的问答模型在对问题进行答复时,若正样本与负样本中给出的答案相似时,容易给出错误答案。
发明内容
本申请实施例提供了一种基于机器学习的问题答复方法、问答模型训练方法及装置,可以解决当正样本与负样本中给出的答案相似时,经典的问答模型容易给出错误答案的问题。所述技术方案如下:
根据本申请的一个方面,提供了一种基于机器学习的问题答复方法,该方法包括:
获取问题;
获取候选答案,候选答案是由正确答案和错误答案拼接在一起形成的答案文档;
调用问答模型对问题与候选答案进行编码,得到向量序列;预测正确答案在向量序列中的位置;输出正确答案的位置对应的子向量序列;
对输出的子向量序列进行解码得到正确答案。
根据本申请的另一个方面,提供了一种问答模型训练方法,该方法包括:
获取训练样本,每组训练样本包括问题样本、答案样本和标定位置;其中,答案样本是由正确答案和错误答案拼接在一起形成的答案文档;
通过问答模型对问题样本与答案样本进行编码,得到样本的向量序列;
通过问答模型预测正确答案样本在样本的向量序列中的位置,并确定正确答案样本的位置与标定位置之间的损失;
根据损失对问答模型中的模型参数进行调整,训练问答模型对正确答案样本的位置预测能力。
根据本申请的另一方面,提供了一种基于机器学习的问题答复装置,该装置包括:
获取模块,用于获取问题;获取候选答案,候选答案是由正确答案和错误答案拼接在一起形成的答案文档;
调用模块,用于调用问答模型对问题与候选答案进行编码,得到向量序列;预测正确答案在向量序列中的位置;输出正确答案的位置对应的子向量序列;
解码模块,用于对输出的子向量序列进行解码得到正确答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910816075.X/2.html,转载请声明来源钻瓜专利网。