[发明专利]一种语义匹配蒸馏方法及装置有效

专利信息
申请号: 202110611463.1 申请日: 2021-06-01
公开(公告)号: CN113204633B 公开(公告)日: 2022-12-30
发明(设计)人: 刘露;包铁;王文博;崔海;彭涛 申请(专利权)人: 吉林大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F40/194;G06F40/279;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京专赢专利代理有限公司 11797 代理人: 李斌
地址: 130012 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语义 匹配 蒸馏 方法 装置
【权利要求书】:

1.一种语义匹配蒸馏方法,其特征在于,包括:

获取用户问句和标准问句至Teacher模型和Student模型中;

对用户问句和标准问句进行分词、去除无意义的词的预处理操作;

将预处理操作后的用户问句与标准问句拼接为一个输入句子,对于输入句子中的每个词都转换为3种形式的向量,分别是词嵌入向量、位置向量和段向量,其中词嵌入向量即为每个词的词向量,表示词的语义信息,位置向量表示词在输入句子中的位置,段向量表示词属于用户问句或是标准问句,最终采用相加的方式将每个词的3个向量相加得到词的特征向量;

将输入句子中的每个词都转换为词的特征向量后得到输入句子向量,然后将输入句子向量分别输入到预先建立的Teacher模型与Student模型中,Teacher模型与Student模型会分别计算用户问句和标准问句的相似度;

将Teacher模型的输出向量与Student模型的输出向量采用第一损失函数计算第一损失,将Student模型的预测值与真实值采用第一损失函数计算第二损失,将Teacher模型的词特征向量与Student模型的词特征向量采用第二损失函数计算第三损失;

将第一损失、第二损失和第三损失相加得到最终的目标函数,采用优化算法对目标函数进行优化,优化完成后得到最终的Student模型;以及

Student模型用于在语义匹配任务中判断用户问句与标准问句是否相似,若相似,预测结果为1,否则预测结果为0;

在将输入句子向量输入到Teacher模型与Student模型之前,还包括:在数据集上预先训练Teacher模型;以及将输入句子向量输入到Teacher模型,Teacher模型的预测值与真实值计算损失,使用优化算法优化Teacher模型,得到最终的Teacher模型;

在计算得到目标函数之前,还包括:给第一损失赋予一个第一权值,给第二损失赋予一个第二权值,给第三损失赋予一个第三权值,其中,权值表示重要程度,第一权值与第二权值的和为1;

将预先训练完成的Teacher模型中包含的语义匹配知识迁移到Student模型中,并构建目标函数优化Student模型,将得到的Student模型应用与语义匹配任务中,判断用户问句与标准问句是否相似,包括:将Teacher模型输出向量中的知识迁移到Student模型的输出向量中,计算第一损失;Student模型学习数据集中的知识,根据Student模型的预测值与真实值,计算第二损失;将Teacher模型词特征向量中的知识迁移到Student模型的词特征向量中,计算第三损失;将第一损失、第二损失和第三损失加权求和得到目标函数;根据目标函数通过优化算法优化Student模型,将知识迁移到Student模型中;以及Student模型判断输入的用户问句与标准问句是否相似。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110611463.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top