[发明专利]针对用户问句的问题分类模型的训练方法和装置在审
申请号: | 201910663095.8 | 申请日: | 2019-07-22 |
公开(公告)号: | CN110399492A | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 王雅芳;龙翀;张晓彤 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书实施例提供一种针对用户问句的问题分类模型的训练方法和装置,获取源领域和目标领域的样本数据,源领域的样本数据有问题分类标签,目标领域的样本数据没有问题分类标签;将源领域的问题样本依次经过编码器和问题分类模型,将源领域的问题样本和目标领域的问题样本依次经过编码器和域分类模型,根据问题分类标签和领域标签,对编码器、问题分类模型和域分类模型进行联合训练,得到训练后的编码器和训练后的问题分类模型。能够在缺乏足够可用的训练样本时,保证训练后得到一个可靠的问题分类模型。 | ||
搜索关键词: | 问题分类模型 编码器 目标领域 问题分类 样本数据 源领域 标签 样本 方法和装置 分类模型 训练样本 获取源 可用 保证 联合 | ||
【主权项】:
1.一种针对用户问句的问题分类模型的训练方法,所述方法包括:获取源领域的样本数据和目标领域的样本数据,所述源领域的样本数据包括源领域的问题样本、问题分类标签和领域标签,所述目标领域的样本数据包括目标领域的问题样本和领域标签,所述源领域和所述目标领域具有相同的分类;将所述源领域的问题样本输入编码器,得到第一特征向量;将所述目标领域的问题样本输入所述编码器,得到第二特征向量;将所述第一特征向量作为样本特征输入问题分类模型,以得到问题分类预测结果,将所述第一特征向量和所述第二特征向量作为样本特征输入域分类模型,以分别得到各自的域分类预测结果,根据所述问题分类预测结果和所述问题分类标签,根据所述域分类预测结果和所述领域标签,对所述编码器、所述问题分类模型和所述域分类模型进行联合训练,得到训练后的所述编码器和训练后的所述问题分类模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910663095.8/,转载请声明来源钻瓜专利网。